abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 21:22 | Nová verze

    Armbian, tj. linuxová distribuce založená na Debianu a Ubuntu optimalizovaná pro jednodeskové počítače na platformě ARM a RISC-V, ke stažení ale také pro Intel a AMD, byl vydán ve verzi 24.5.1 Havier. Přehled novinek v Changelogu.

    Ladislav Hagara | Komentářů: 0
    včera 19:44 | IT novinky

    Společnost xAI založena Elonem Muskem a stojící za AI LLM modelem Grok získala investici 6 miliard dolarů.

    Ladislav Hagara | Komentářů: 0
    včera 15:44 | IT novinky

    Finálový zápas mistrovství světa v ledním hokeji přinesl nový rekord NIX.CZ (𝕏): "Dosavadní absolutní maximum našeho propojovacího uzlu bylo překonáno v čase 21:10, kdy jsme při přenosu dat dosáhli 3,14 Tbps. Je třeba také doplnit, že po deváté hodině večerní byly na maximu i ostatní datové přenosy nesouvisející s hokejovým šampionátem".

    Ladislav Hagara | Komentářů: 2
    včera 15:11 | Pozvánky

    Přihlaste svou přednášku na další ročník konference LinuxDays, který proběhne 12. a 13. října na FIT ČVUT v pražských Dejvicích. CfP poběží do konce prázdnin, pak proběhne veřejné hlasování a výběr přednášek.

    Petr Krčmář | Komentářů: 0
    25.5. 19:00 | Zajímavý projekt

    Na crowdsourcingové platformě Crowd Supply byla spuštěna kampaň na podporu open source biometrického monitoru ve tvaru hodinek HealthyPi Move. Cena je 249 dolarů a plánovaný termín dodání listopad letošního roku.

    Ladislav Hagara | Komentářů: 13
    24.5. 22:22 | Upozornění Ladislav Hagara | Komentářů: 21
    24.5. 17:44 | Nová verze

    Firma Murena představila /e/OS verze 2.0. Jde o  alternativní sestavení Androidu bez aplikací Google. Mezi novinkami je podrobnější nastavení ochrany soukromí před sledováním aplikacemi. Murena prodává několik smartphonů s předinstalovaným /e/OS (Fairphone, repasovaný Google Pixel 5).

    Fluttershy, yay! | Komentářů: 0
    24.5. 14:33 | Zajímavý software

    Do 30. května lze v rámci akce Warhammer Skulls 2024 získat na Steamu zdarma hru Warhammer 40,000: Gladius - Relics of War.

    Ladislav Hagara | Komentářů: 1
    24.5. 13:33 | Nová verze

    HelenOS (Wikipedie), tj. svobodný operační systém českého původu založený na architektuře mikrojádra, byl vydán ve verzi 0.14.1. Přehled novinek v poznámkách k vydání. Vypíchnou lze nabídku Start. Videopředstavení na YouTube.

    Ladislav Hagara | Komentářů: 3
    23.5. 23:22 | Zajímavý software

    BreadboardOS je firmware pro Raspberry Pi Pico (RP2040) umožňující s tímto MCU komunikovat pomocí řádkového rozhraní (CLI). Využívá FreeRTOS a Microshell.

    Ladislav Hagara | Komentářů: 0
    Podle hypotézy Mrtvý Internet mj. tvoří většinu online interakcí boti.
     (89%)
     (3%)
     (4%)
     (4%)
    Celkem 906 hlasů
     Komentářů: 16, poslední 14.5. 11:05
    Rozcestník

    Ano, uznávám, pomalu, ale jistě to na mém blogu vyhnívá... hlavně kvůli nedostatku času a nápadů, co si budeme povídat :-/ No a jelikož se většina mých zápisků v poslední době čím dál tím více odchylovala od zaměření ABC Linuxu, rozhodl jsem se založit tématicky volný blog Letters from Earth, na který jsem zároveň přesunul zápisky odsud za poslední půlrok.

    FuxBlog budiž tedy nadále ryze technickým blogem se zaměřením na IT. Snad na něj budu mít čas...

    Aktuální zápisy

    Chyba v Jádře?

    11.1.2010 09:16 | Přečteno: 1317× | Linuxení aneb hrátky se šrotem | poslední úprava: 11.1.2010 09:16

    Před nedávnem jsem dostal nový služební počítač, se čtyřjádrem od AMD. Osadil jsem jej velmi čerstvou openSUSE 11.2 (kernel 2.6.31.5), nainstaloval aplikace a vše běželo jako po másle. Až na BOINC...

    S programem BOINC, respektive s prací, kterou přijímal (v mém případě: rosetta@home, Einstein@home, lhc@home) jsem nikdy neměl problémy - vše se vždy na předchozím PC (dvojjádro AMD, openSUSE 10.3, kernel 2.6.22.19) spočetlo, jak mělo, a to i když jsem počítači dával kouř jak se patří (týdenní výpočty MKP a podobně). Nyní se ale začaly objevovat chyby ve výpočtech, které Einstein@home kvalifikoval jako Client Errors.

    První problémy začaly s využíváním GPU pro výpočty BOINCu. Vzhledem k tomu, že BOINC není schopen používat pro výpočty GPU ATI s proprietárními ovladači (tehdy jsem měl Catalyst 9.11), nehodlal se mi nastartovat BOINC client, což vyřešilo explicitní vypnutí GPU v konfiguračním souboru (celý postup je zde). Pak se mi již podařilo BOINC bez problémů zprovoznit a začaly se objevovat ony Client Errors.

    Vrcholem všeho byla chvíle, kdy jsem byl na víkend pryč a při pohledu na statistiky jsem viděl ve výsledcích pouze Client Error, a to asi u třiceti workunit. Po návratu do práce jsem zjistil, že došlo k pádu plasmy a kwin4 a ve chvíli, kdy jsem hnul s myší má Xka spadla. Po restartu vše naběhlo OK, jen se prostě čas od času objeví naprosto zbytečná Client Error.

    Rozhodl jsem se tedy napsat do fóra Einstein@home, zda někdo nemá podobné problémy. (Celý thread je zde.) Po všech možných úvahách (chyba CPU, problémy s GPU a podobně) vše ukazuje na chybu jádra. tato chyba by se měla projevovat pouze ve chvílích, kdy větší počet aplikací, nežli je počet fyzických jader, chce využívat CPU na 100%.

    Důvodem k tomuto podezření (symptomy chyby) je:

    A nyní můj dotaz: je možné, aby chyba vznikala tímto mechanizmem? Oficiálně se tvrdí, že tato chyba byla odstraněna v jádře 2.6.27 (její příčinou je nastavení CONFIG_PREEMPT), nicméně, jak zjistili někteří diskutující, právě tato nastavení umožňuje chybovost workunit ovlivnit. A ještě jeden dotaz: máte někdo podobné zkušenosti s touto chybou, a to ať už v rámci BOINC nebo v rámci jiné aplikace?


    Ok, vím, že jde vlastně o dotaz, ale jednak je úvod k němu docela dlouhý a jednak bych rád vyvolal širší diskuzi o této chybě, včetně toho, zda a jak ji hlásit.


    Díky moc,
    Pushkin

           

    Hodnocení: 67 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    11.1.2010 10:01 fraxinus | skóre: 20 | blog: fraxinus
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    A skusal si co sa stane ked spustis (PocetJadier+1) procesov so 100% zatazou? Napr. nejaku nekonecnu slucku v c. Ide mi o vylucenei vplyvy komplexnych aplikacii ako je boinc alebo kde.
    void main(void) {
      while(1) {
      }
    }
    
    pushkin avatar 11.1.2010 10:14 pushkin | skóre: 43 | blog: FluxBlog
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    OK, zkusím. Jenom takový začátečnický dotaz ... jak to zkompilovat? :-)
    11.1.2010 10:22 trekker.dk | skóre: 72
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    gcc -o program program.c
    Quando omni flunkus moritati
    pushkin avatar 11.1.2010 10:37 pushkin | skóre: 43 | blog: FluxBlog
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Bezva, díky, už jsem tím vytížil dvě jádra. Uvidíme, jak to dopadne.
    11.1.2010 13:44 fraxinus | skóre: 20 | blog: fraxinus
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Skus viacej ako mas jadier. Napr. 10 procesov. Ak mas dve jadra (bez HT) tak load by mal byt asi 5.
    pushkin avatar 11.1.2010 16:55 pushkin | skóre: 43 | blog: FluxBlog
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Uvidíme, zatím mám spuštěnou tu nekonečnou smyčku 2x, takže o zbylá dvě jádra se dělí čtyři aplikace z BOINCu, to už by generovat chyby mohlo. Uvidíme zítra.
    11.1.2010 18:05 Ivan
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Tak jsem koukal na ten patch a tam se mluvi o FPU. Jestli si jeste dobre pamatuju problematiku a tak je problem s tim, ze pri prepnuti kontextu procesu by se mely zazalohovat hodnoty vsech registru, tzn. i FPU. To by bylo ale pomaly a hlavne ne vsechny aplikace FPU pouzivaji. Proto ma FPU flag, ktery rika jestli byla/nebyla pouzita a OS zalohuje stav FPU pouze pokud je tento flag nastaven. Podle komentare k tomu patchi to vypada, ze behem poslednich par let pribyla do kernelu heuristika, ktera rika kdy zalohovat stav FPU, a ta nejak "blble" pri preentivnim modu.
    pushkin avatar 12.1.2010 07:13 pushkin | skóre: 43 | blog: FluxBlog
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Tak jsem nechal běžet nějakých 18 hodin tu nekonečnou smyčku na dvou jádrech. Výsledek: Einstein@home má 4 zničené workunity, pouze dvě se dopočítaly do konce (souhrn). Tato workunita padla ještě před zacyklením jader.
    14.1.2010 10:53 fraxinus | skóre: 20 | blog: fraxinus
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Nerozumiem. Co je to zacyklenie jadier? Zamrzol pocitac po 18tich hodinach?
    pushkin avatar 14.1.2010 11:11 pushkin | skóre: 43 | blog: FluxBlog
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    nn, vzal jsem tu nekonečnou smyčku, zkompiloval jí a spustil (2x). Každý z těch procesů zatížil naplno jedno jádro, takže zbytek procesů běžel na zbylých dvou jádrech. Jinak počítač nezamrznul, ty dvě smyčky jsem po 18 hodinách killnul.
    11.1.2010 10:30 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: Chyba v Jádře?

    Z toho, že jedna aplikace blbne, nota bene uzavřená binárka, a která místo rozumného vysvětlení vrátí akorát nic neříkající číselný kód, věštit, že je chyba v jádře, je opravdu odvážné.

    pushkin avatar 11.1.2010 10:43 pushkin | skóre: 43 | blog: FluxBlog
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Mno, ona ta binárka až tak uzavřená není a poskytuje i poměrně dobrý výstup (1, 2, 3, 4, atd...). Navíc se ta chyba kromě Einsteinu objevuje i v Rosettě...
    11.1.2010 12:43 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: Chyba v Jádře?

    Aha, autoři BOINC otevřeli. Tak to je jiná.

    Zmiňovaný src/protocols/ProteinInterfaceDesign/read_patchdock.cc jste už prohlížel, že si myslíte, že je chyba v jádře? Je totiž dost možné, že mají v aplikaci chybu souběhu nebo zapomněli ošetřit nepřidělení paměti nebo cokoliv jiného, co může způsobit změněné chování jádra, které přesto je zcela v souladu s API/ABI.

    pushkin avatar 11.1.2010 16:53 pushkin | skóre: 43 | blog: FluxBlog
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Na tu chybu v jádře mě zaměřil fakt, že se již jednou v jádře vyskytovala a byla údajně i opravena. Jinak zdrojové kódy jsem nestudoval, tak daleko moje znalosti céčka nesahají :-(
    11.1.2010 11:48 Michal2
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Jaka chyba v jadre? To jsou naprosto bezne priznaky potizi s procesorem nebo pameti. A ze jsem jich jako hardore overclocker uz videl :-)

    Pro overeni sosnout prime95 http://www.mersenne.org/freesoft/ (pokud mas 64bit distro tak 64bit vezi) a spustit v torture rezimu.
    pushkin avatar 11.1.2010 11:54 pushkin | skóre: 43 | blog: FluxBlog
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    O tomhle jsme taky uvažovali, ale je to divné. Memtest86+ mi paměť projel dvakrát a problém nenašel a co se týče CPU, tak to přetaktované nemám. Celý systém se pak chová stabilně - tedy až na onen jeden výpadek plasmy a kwinu. Ale ten nástroj zkusím, čím víc testů, tím lépe. Díky
    11.1.2010 12:09 Dr. Eddy | skóre: 9 | blog: glog | České Budějovice
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Koukal jsem, ze jsi nechal bezet Memtest nejdrive 35min, pak hodinu - pokud se nepletu, tak memtest zkousi ruzne testy pameti, kdy nekolikrat projede pamet. Nekteri nechavaji Memtest bezet i nekolik hodin (ja jsem nechal treba 3 hodiny, nekdo jiny 8 hodin)...
    11.1.2010 13:43 fraxinus | skóre: 20 | blog: fraxinus
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Memtest & spol. dokaze len pritomnost chyby, nie jej absenciu!
    kotyz avatar 11.1.2010 12:46 kotyz | skóre: 25 | blog: kotyzblog | Plzeň
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    me einstein, seti i rosetta jedou dobre, ale climate prediction sem musel zrusit, protoze mel moc dlouhy workunity a ani jedna se mi nikdy nedopocitala, skoncila po par hodinach s chybou. system je ale stabilni a memtest nic nenasel.
    Hrdý člen KERNEL ULTRAS. | Furry/Brony/Otaku | Nemám čas ztrácet čas. | In 'pacman -Syu' we trust!
    11.1.2010 13:31 RapMan | skóre: 14 | blog: RapMan
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Vy fakt verite, ze to pocita nejaka smysluplna data?
    11.1.2010 13:50 fraxinus | skóre: 20 | blog: fraxinus
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Ja si to nemyslim. Stacil mi letmy pohlad na data ktore SETI spracovava aby mi bolo jasne ze nikdy nic nenajdu. Ked totiz ovzorkujete biely sum, bethovenovu piatu symfoniu alebo dokonaly sinus 1Hz vzorkovacou frekvenciou (arecibo) dostanete na vystupe 1Hz biely sum.
    pushkin avatar 11.1.2010 16:51 pushkin | skóre: 43 | blog: FluxBlog
    Rozbalit Rozbalit vše Re: Chyba v Jádře?
    Já doufám, že ano, jinak by to bylo docela mrhání výpočetním výkonem...

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.