abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 00:33 | Nová verze

    Webový prohlížeč Dillo (Wikipedie) byl vydán ve verzi 3.1.0. Po devíti letech od vydání předchozí verze 3.0.5. Doména dillo.org již nepatří vývojářům Dilla.

    Ladislav Hagara | Komentářů: 0
    včera 15:00 | Komunita

    O víkendu probíhá v Bostonu, a také virtuálně, konference LibrePlanet 2024 organizovaná nadací Free Software Foundation (FSF).

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | Nová verze

    Nová vývojová verze Wine 9.8 řeší mimo jiné chybu #3689 při instalaci Microsoft Office 97 nahlášenou v roce 2005.

    Ladislav Hagara | Komentářů: 0
    3.5. 13:11 | Nová verze

    Coppwr, tj. GUI nástroj pro nízkoúrovňové ovládání PipeWire, byl vydán v nové verzi 1.6.0. Zdrojové kódy jsou k dispozici na GitHubu. Instalovat lze také z Flathubu.

    Ladislav Hagara | Komentářů: 0
    2.5. 22:33 | Nová verze

    Byla vydána dubnová aktualizace aneb nová verze 1.89 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a animovanými gify v poznámkách k vydání. Vypíchnout lze, že v terminálu lze nově povolit vkládání kopírovaného textu stisknutím středního tlačítka myši. Ve verzi 1.89 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 19
    2.5. 21:22 | Nová verze

    Proton, tj. fork Wine integrovaný v Steam Play a umožňující v Linuxu přímo ze Steamu hrát hry určené pouze pro Windows, byl vydán ve verzi 9.0-1 (𝕏). Přehled novinek se seznamem nově podporovaných her na GitHubu. Aktuální přehled her pro Windows běžících díky Protonu také na Linuxu na stránkách ProtonDB.

    Ladislav Hagara | Komentářů: 2
    2.5. 19:33 | Nová verze

    Byla vydána verze 1.78.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání na GitHubu. Vyzkoušet Rust lze například na stránce Rust by Example.

    Ladislav Hagara | Komentářů: 0
    2.5. 11:22 | Bezpečnostní upozornění

    Služba Dropbox Sign (původně HelloSign) pro elektronické podepisování smluv byla hacknuta.

    Ladislav Hagara | Komentářů: 3
    2.5. 11:00 | Nová verze

    Byla vydána nová major verze 8.0 textového editoru GNU nano (Wikipedie). Podrobný přehled novinek a oprav v oznámení v diskusním listu info-nano nebo v souboru ChangeLog na Savannah. Volbou --modernbindings (-/) lze povolit "moderní" klávesové zkratky: ^C kopírování, ^V vložení, ^Z vrácení zpět, … Tato volba je aktivována také pokud binárka s nano nebo link na ni začíná písmenem "e".

    Ladislav Hagara | Komentářů: 4
    1.5. 23:22 | IT novinky

    Před 60 lety, 1. května 1964, byl představen programovací jazyk BASIC (Beginners' All-purpose Symbolic Instruction Code).

    Ladislav Hagara | Komentářů: 23
    Podle hypotézy Mrtvý Internet mj. tvoří většinu online interakcí boti.
     (51%)
     (11%)
     (22%)
     (16%)
    Celkem 63 hlasů
     Komentářů: 8, poslední včera 08:25
    Rozcestník

    Dotaz: BTRFS error state EAL - Debian 12 - 2x SSD

    25.3. 10:15 Howard | skóre: 19
    BTRFS error state EAL - Debian 12 - 2x SSD
    Přečteno: 1063×
    Jednou za 2-3 měsíce se stane, že se server zasekne a na obrazovce je hromada hlášek:
    [2420966.279450] BTRFS error (device nvme0n1p2): bdev /dev/nvme0n1p2 errs: wr 1173, rd 2291, flush 0, corrupt 0, gen 0
    
    Jedná se o Debian 12 se standardními repozitáři pravidelně aktualizovaný jednou týdně.
    # uname -a
    Linux 6.1.0-18-amd64 #1 SMP PREEMPT_DYNAMIC Debian 6.1.76-1 (2024-02-01) x86_64 GNU/Linux


    Disky - 2x 1 TB Samsung SSD 990 PRO FS samozřejmě BTRFS, na jednom disku je boot, kořenový oddíl a swap. Druhý disk slouží jako rozříšení kořenového oddílu pomocí btrfs device add, tedy to funguje jako RAID 0.

    Badblocks obou disků ani btrfs scrub neukázal žádné chyby. Journalctl -b -1 končí na opakující se takovéto hlášky:
    bře 24 16:48:01 207 CRON[3484705]: pam_unix(cron:session): session opened for user root(uid=0) by (uid=0)
    bře 24 16:48:01 207 CRON[3484706]: (root) CMD (/root/scripts/load_check)
    bře 24 16:48:01 207 CRON[3484705]: pam_unix(cron:session): session closed for user root
    bře 24 16:48:21 207 earlyoom[1226980]: mem avail: 45136 of 63436 MiB (71.15%), swap free: 12268 of 19066 MiB (64.34%)
    Ani v žádném jiném logu jsem nenašel žádnou chybu, jako když prostě selže disk a systém chybu už nemůže zapsat na disk, pouze na obrazovku.

    Zatím jsem neměl příležitost nechat běžet memtest ani btrfs check, server musí běžet. Doporučujete udělat memtest a btrfs check?

    Může se jednat o bug v kernelu, i když se jedná o stabilní Debian? Mám zkusit nainstalovat jiné jádro?

    Případně co dál řešit?

    Odpovědi

    25.3. 11:38 P.V.
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Mozna to chce rebalans.
    25.3. 12:46
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Doporučujete udělat memtest a btrfs check?
    A co bys tak očekával, že dostaneš za radu? Btrfs ti píše, že error... Tak pěkně na btrfs zkontroluj, co můžeš. Pak můžeš přemýšlet, jak postupovat dál.
    25.3. 12:59 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    A jenom bych si přisadil. Prostuduj si také blogpost Všechno má svůj čas, speciálně pasáž „Proč nechci mít jen jeden disk”, kde máš odpověď i na otázku, co děláš blbě.
    25.3. 13:03 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Jo a taky nebude od věci když si přečteš blogposty, mého kamaráda: Případ zhrouceného notebooku a Nasysleno.
    Max avatar 25.3. 15:44 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Jakou verzi FW máš v těch NVMe?
    Jaký chipset máš v tom serveru?
    Zdar Max
    Měl jsem sen ... :(
    6.4. 00:41 Want
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Jakou verzi FW máš v těch NVMe? Jaký chipset máš v tom serveru?
    Vis podrobnosti o rozdilech ve verzich? kdyz ti rekne verzi co bude nasledovat za radu?
    6.4. 12:00 Vantomas | skóre: 32 | Praha
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Prostá zkušenost se Samsung SSD. Mají v těch firmwarech bugy, že ta SSD na dlouho lagnou nebo se nějak zrestartují a zmizí/objeví se na sběrnici, když běží už příliš dlouho. A to samozřejmě filesystémy a jiný věci nemají rády. No a když pošle verzi, co je až moc příliš stará, tak se dá předpokládat, že problém bude tam.
    Max avatar 6.4. 13:38 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Můžu např. zjistit, že existuje novější verze fw. Nebo lze podle konkrétní verze dohledat, zda nemá nějaký problém.
    Zdar Max
    Měl jsem sen ... :(
    6.4. 16:27 Want
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Doufám Maxi, že ti je jasné že můj nick zneužívá nějaký šmudla. Nicméně - jsem nakloněn tomu dát pivko, takže jak budeš mít ideální okno, stačí echo.
    6.4. 17:09 Want
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    můj nick
    ID? nebo staci byt ve strane?
    6.4. 18:30
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Jen jestli se ty neskrýváš za nickem nějakého šmudly...
    6.4. 18:53 Want
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Buď bez obav mantáku. Max ví na jaké číslo zavolat.
    25.3. 16:55 X
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Nemuze byt problem s deskou? Nejaka diagnostika neni?
    5.4. 15:16 lertimir | skóre: 64 | blog: Par_slov
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Nějak vůbec nerozumím slovnímu spojení "server" a "RAID 0". Svým studentům už desítky let tluču do hlav, že jakýkoliv kus hardware může v kterýkoliv okamžik selhat, a tak že je naprosto neopravitelný. A když si přečtu toto, tak mám pocit s klasikem: Je to marné, je to marné, ne to marné.
    6.4. 17:23 alkoholik | skóre: 40 | blog: Alkoholik
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Kde se sakra flaka Andrej?
    Hadam, ze do NVMe error logu jsi se uz podival a jsou taky prazdne..
    6.4. 21:17 pavele
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    V případě chyby btrfs se Andrej nevyskytuje. :-)

    Samozřejmě všichni diskutující označí tazatele za absolutního amatéra, neschopného hlupáka, s vadným hardwarem - nevhodná základní deska, disky nevhodné pro btrfs, zastaralým softwarem, s nepoužitelnou distribucí a poradí mu, aby si raději najal firmu na opravu. :-)

    Tak jako už mnohokrát dříve. :-(

    Max avatar 6.4. 21:37 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Pár lidí, co tu mělo rozpadlé btrfs, používalo zabugované Samsungy 960/970 řady, kde opravdu byla chyba v jejich fw a v kombinaci s určitými chipsety mohlo dojít ke ztrátě dat. V linux komunitě se to řešilo několik let a postupně se to vyřešilo tak, že u těch ssd vypínal kernel TRIM, NCQ a další věci.
    V případě řady 990 Pro nevím o ničem, ale tazatel nekomunikuje, takže se asi příčiny nedopátráme. Je ale vidět, že ty máš hned jasno :D.
    Zdar Max
    Měl jsem sen ... :(
    25.4. 09:59 chinook | skóre: 28
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Já mám asi ten stejný problém.

    
    Model Number:                       Samsung SSD 990 PRO 4TB
    Firmware Version:                   0B2QJXG7
    
    Linux node 5.10.0-27-amd64 #1 SMP Debian 5.10.205-2 (2023-12-31) x86_64 GNU/Linux
    
    

    Co jsem se díval firmware je na webu novější, ale nenašel jsem, že by opravil tyto chyby. Disk je celkem dost vytížen. A po týdnu nebo dvou. Začne hlásit stejné chyby jak tady kolegovi. Restart PC dále disk nenajde. Ale pokud PC vypnu a zapnu, tak to zase nějaký týden jede v pohodě. Měl jsem podezření, že se to přehřívá, koupil jsem chladič otevřel case snížil teplotu o 20stupnu a furt stejný. Přemýšlím, že koupím jiný disk. Ale ještě tomu chci dát šanci. Pomohl by upgrade kernelu na 6x?
    Max avatar 25.4. 21:40 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Díky za info. Hele, v changelogu firmware nemusí být uvedeno vše. Je to na benevolenci vendora. Jinak už jen to, že po restartu nevidíš disk, je velký špatný. To by se dít opravdu nemělo. Buď máš vadný disk, nebo nějaký bug v desce, nebo těžko říci. Začal bych full updatem fw, tj. i biosu desky.
    Teploty NVMe můžeš sledovat, např. 80C je už podle mě přes čáru. Já mám běžnou teplotu kolem 47C.
    Pasiv používám, bez něj to nejde, ale taktéž to nejde bez průvanu ve skříni. Obzvláště, když má člověk nvme pěkně u výkonné GPU, která topí vostošest.

    Hele, poměrně nový kritický bug v 990 Pro: Avoid Loss of Data: Upgrade Your Samsung 980 & 990 Pro SSD to the Latest Firmware (0E error fix).
    Ale těžko říci, zda se ho ten bug týká, bo jinde vyráběný s trochu jinými čipy: Samsung 990 PRO Firmware 0B2QJXG7 is it okay?
    Pokud je dostupný nový fw, tak bych rozhodně udělal update.
    Jinak Debian má aktuálně kernel 6.1 ve stable větvi, takže řekl bych, že to je signál, nebát se do toho jít. Pětkový kernel už je opravdu dědeček.
    Zdar Max
    Měl jsem sen ... :(
    2.5. 14:47 chinook | skóre: 28
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Uvidíme, již skoro týden mám aktualizovaný FW na desce od DELLu Precision 3650 Tower. Tuším z verze 1.12 na 1.30.

    Jádro na: Linux node 6.1.0-20-amd64 #1 SMP PREEMPT_DYNAMIC Debian 6.1.85-1 (2024-04-11) x86_64 GNU/Linux

    Disk je teď sice méně vytížen, protože po upgrade z debian 11 na debian 12 jedna aplikace, která to dosti vytěžovala přestala jet a nedokážu ji zprovoznit.

    Teplota ssd disku je 41 stupnu bývala 45 když ještě běžela ta aplikace.

    Zatím nedovedu posoudit jestli upgrade pomohl. Uvidíme časem. Disk jsem zatím neupgradoval, budu muset sehnat disk s win, abych tam nabootoval a upgrade provedl.

    Max avatar 2.5. 15:32 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Mělo by to jít i přímo z Linuxu: Samsung SSD Firmware.
    Zdar Max
    Měl jsem sen ... :(
    2.5. 18:03 chinook | skóre: 28
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Super, přitom jsem hledal a nenašel to.

    Update proveden.

    Firmware Version: 4B2QJXD7

    Teď ještě zrpovozním tu aplikaci co to vytěžuje a za cca 7-14 dní uvidíme.
    Max avatar 3.5. 00:54 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Díky, tak pak dej info.
    Zdar Max
    Měl jsem sen ... :(
    6.4. 23:25 xxl | skóre: 25
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Andrej tady už kolikrát psal, že chyby hlášené btrfs dost často upozorňují na vadný hardware, jako je třeba paměť. A i sám tazatel tušil, že problém nemusí být přímo v btrfs. Kromě toho tazatel také psal, že btrfs scrub skončil bez chyb. To znamená, že data byla patrně dosud v pořádku.

    Takže bych netvrdil, že je to chyba btrfs.
    7.4. 11:17 pavele
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Netvrdím, že je to chyba btrfs.

    Tvrdím, že co se týče (nejen) btrfs, nikdy (poslední měsíce?) tu nebyla konstruktivní debata, která by vedla k vyřešení problému a pomohla tázajícímu.

    Navíc si nejsem jist, jestli většina dotazů nejsou uměle vytvořené, aby to tu aspoň trochu žilo. Tazatel hodí otázku a pak se už neozve.

    Před lety měli všichni snahu a ochotu problém vyřešit. Možná se mýlím. :-(
    Jendа avatar 3.5. 11:09 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Kromě toho tazatel také psal, že btrfs scrub skončil bez chyb. To znamená, že data byla patrně dosud v pořádku.

    Takže bych netvrdil, že je to chyba btrfs.
    Klasický omyl. Scrub nekontroluje strukturu FS, ale jen checksumy bloků. Pokud k chybě (softwarové - race conditions, přepsání kusu paměti nesouvisejícím zabugovaným modulem…; hardwarové - bitflip v paměti) došlo před spočítáním checksumu, tak scrub projde, ale FS není konzistentní. K ověření konzistence slouží btrfs check. Čím ho pak opravit - těžko říct. btrfs-check má v manuálu napsáno že se nemá pro opravy používat. Nejspíš tedy vykopírovat data pryč, FS vytvořit znova, zkopírovat data zpět a doufat že to nebudeš muset dělat moc často. No, furt lepší než ZFS, kde fsck nemají vůbec, ani read-only variantu.
    Max avatar 3.5. 11:26 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    No, nevím, ZFS mi přijde super. Rok se ho snažím zbořil a přijít o data, mám v poolu x vadných disků a pořád se to snažím nějak zneškodnit a čekám, kdy to padne. Jednou to mělo na mále (dvě RAIDZ skupiny se rozpadly), ale nakonec to stejně přežil a skupiny znovu sestavil a s datama nebyl problém. Celkově je to hodně drsně dobrý řešení.
    Zdar Max
    Měl jsem sen ... :(
    3.5. 13:02 xxl | skóre: 25
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Klasický omyl.
    Tak za prvé. Napsal jsem
    data byla patrně dosud v pořádku.
    protože si uvědomuji, že k podobné věci může dojít.

    A za druhé. I pokud k nějaké
    chybě (softwarové - race conditions, přepsání kusu paměti nesouvisejícím zabugovaným modulem…; hardwarové - bitflip v paměti) došlo před spočítáním checksumu
    tak je to chyba btrfs pouze tehdy, pokud to btrfs sám způsobil. ;-) Což u většiny těch věcí, o kterých píšeš, neplatí. Kromě toho si myslím, že pokud by to dělal přímo btrfs, bylo by postižených víc.

    Ovšem my nevíme, jak to v našem případě dopadlo, protože tazatel nekomunikuje.

    Max avatar 3.5. 13:39 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Ale máš tu chinooka, který potvrdil nějaký problém se stejným / podobným modelem Samsungu + linky na big fatal chybu ve fw.
    Takže i když tazatel nekomunikuj, máme tu další případ se shodným modelem, který naznačuje problém na hw/fw úrovni.
    Zdar Max
    Měl jsem sen ... :(
    3.5. 13:53 xxl | skóre: 25
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    No jo, ale to přece není chyba btrfs.

    Mimochodem, tyhlety chyby:
    [2420966.279450] BTRFS error (device nvme0n1p2): bdev /dev/nvme0n1p2 errs: wr 1173, rd 2291, flush 0, corrupt 0, gen 0
    jsem měl minulý týden v logu taky. Taky Samsung, ale 2,5' SATA. Ovšem kromě těchto chyb od btrfs mi to hlásilo i hw chyby v logu a také chyby při smart testech. Disk jsem vyreklamoval. Data, zdá se, v pořádku, měl jsem tam raid.
    Max avatar 3.5. 14:01 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Já jen reagoval na "Ovšem my nevíme, jak to v našem případě dopadlo, protože tazatel nekomunikuje.", čímž jsem chtěl říci, že vzhledem k dalšímu podobnému problému asi víme, odkud vítr vane.
    Zdar Max
    Měl jsem sen ... :(
    Jendа avatar 3.5. 23:34 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: BTRFS error state EAL - Debian 12 - 2x SSD
    Nebyla jedna z hlavních propagovaných vlastností btrfs, že má díky svým checksumům proti chybám disku chránit (resp. je scrub má alespoň detekovat)?

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.