abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 10:44 | Zajímavý článek

    Alyssa Rosenzweig se v příspěvku na svém blogu Vulkan 1.3 na M1 za 1 měsíc rozepsala o novém Vulkan 1.3 ovladači Honeykrisp pro Apple M1 splňujícím specifikaci Khronosu. Vychází z ovladače NVK pro GPU od Nvidie. V plánu je dále rozchodit DXVK a vkd3d-proton a tím pádem Direct3D, aby na Apple M1 s Asahi Linuxem běžely hry pro Microsoft Windows.

    Ladislav Hagara | Komentářů: 4
    dnes 01:00 | Nová verze

    Byla vydána (𝕏) květnová aktualizace aneb nová verze 1.90 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a animovanými gify v poznámkách k vydání. Ve verzi 1.90 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 0
    dnes 00:44 | Nová verze

    Byla vydána (Mastodon, 𝕏) nová verze 2024.2 linuxové distribuce navržené pro digitální forenzní analýzu a penetrační testování Kali Linux (Wikipedie). Přehled novinek se seznamem nových nástrojů v oficiálním oznámení.

    Ladislav Hagara | Komentářů: 0
    včera 16:44 | IT novinky

    Počítačová hra Tetris slaví 40 let. Alexej Pažitnov dokončil první hratelnou verzi 6. června 1984. Mezitím vznikla celá řada variant. Například Peklo nebo Nebe. Loni měl premiéru film Tetris.

    Ladislav Hagara | Komentářů: 10
    včera 10:44 | Nová verze

    MicroPython (Wikipedie), tj. implementace Pythonu 3 optimalizovaná pro jednočipové počítače, byl vydán ve verzi 1.23.0. V přehledu novinek je vypíchnuta podpora dynamických USB zařízení nebo nové moduly openamp, tls a vfs.

    Ladislav Hagara | Komentářů: 0
    včera 10:22 | Nová verze

    Canonical vydal Ubuntu Core 24. Představení na YouTube. Nová verze Ubuntu Core vychází z Ubuntu 24.04 LTS a podporována bude 12 let. Ubuntu Core je určeno pro IoT (internet věcí) a vestavěné systémy.

    Ladislav Hagara | Komentářů: 2
    včera 01:00 | Nová verze Ladislav Hagara | Komentářů: 0
    4.6. 19:55 | IT novinky

    Intel na veletrhu Computex 2024 představil (YouTube) mimo jiné procesory Lunar Lake a Xeon 6.

    Ladislav Hagara | Komentářů: 0
    4.6. 13:44 | IT novinky

    Na blogu Raspberry Pi byl představen Raspberry Pi AI Kit určený vlastníkům Raspberry Pi 5, kteří na něm chtějí experimentovat se světem neuronových sítí, umělé inteligence a strojového učení. Jedná se o spolupráci se společností Hailo. Cena AI Kitu je 70 dolarů.

    Ladislav Hagara | Komentářů: 0
    4.6. 13:22 | Nová verze

    Byla vydána nová verze 14.1 svobodného unixového operačního systému FreeBSD. Podrobný přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    Rozcestník

    Pacemaker - problém se integrací nodu

    20.11.2014 11:56 | Přečteno: 910× | Za vším hledej Linux | Výběrový blog | poslední úprava: 21.11.2014 12:57

    Poučné vyprávění o lapálii včerejšího podvečera

    Při aplikaci změn síťové konfigurace - viz včerejší blogpost na téma Jak skamarádit openvswitch a systemd, se ukázalo že onen pomyslný jásot byl poněkud předčasný. Neumím totiž ovlivnit pořadí služeb, jsou-li nahazované přes systemd, což je u Pacemakeru docela podstatná věc.

    Dokud jsem měl nainstalován pouze balík systemd, bez balíku systemd-sysv, tak se systemd pokoušel spustit corosync a pacemaker, ještě před nahozením openvswitche. To logicky končilo selháním, protože v tu dobu ještě rozhraní, přes které má probíhat komunikace corosyncu ještě neexistují.

    Po doinstalování balíku systemd-sysv byl výsledek ještě tristnější - k nahození virtuálních síťových rozhraní nedošlo vůbec. Možná by se to dalo pořešit přes obligátní:

    ..
        up ip link set $IFACE up
        down ip link set $IFACE down
    ..

    ..jenže to už mi začala docházet trpělivost.

    Nod gg, na kterém jsem s tím laboroval, se totiž začal chovat poněkud divně. Ačkoliv konfigurace sítě byla zcela identická jako u výchozího nodu ga - pochopitelně až na jiné adresy - síť po restartu nejprve naskočila pak škytla, spadla.. Po chvíli zase naskočila, pak zase spadla.. Při dalším naskočení jsem se přihlásil a zkusil systemd opět odinstalovat, jenže během této operace připojení upadlo definitivně. Nezbylo než dojít dolů do serverovny, zapíchnout monitor s klávesnicí a problém pořešit rovnou u stroje.

    Na monitoru byl kernel panic. Zmáčknul jsem reset a koukal co se bude dít - opět kernel panic. Zkusil jsem starší kernel. Zase kernel panic. To už mi bylo divné. Najel jsem do ramdisku. Namountoval systémový disk. Potud vše ok. Chci se přepnout přes chroot do systému a tu to na mne zařvalo input/output error a nic. Zkusím ls, find. Žádný problém. No koukal jsem na to jako blázen, tak jsem si přizval na pomoc kolegu, Pavla Píšu.

    Nebudu vás dále napínat. Ukázalo se, že systémový disk je na cestě do věčných lovišť a s vadnými sektory si ani Btrfs neporadí.

    Až potud žádný problém. Systém všech nodů je identický. Vykuchal jsem disk, místo něj vrazil nový na který jsem naklonoval po síti systém z nodu ga. Nabootoval systemrescuecd, skočil do chrootu, upravil hostname, síťovou konfiguraci, nakopíroval certifikáty puppetu a reinstaloval grub2.

    Jenže ouha! Systém najel, Puppet přeplácnul co měl, ale do clusteru se nod nezapojil. Co to?! No blbnul jsem s tím do dvou do rána, ovšem bezvýsledně. X krát jsem mazal konfiguraci i soubory které náleží ke corosyncu a pacemakeru. Kontroloval konfigurační soubory a nastavení práv - přičemž jsem odhalil i některé trapné chyby a překlepy. Ovšem stále nic. Nakonfiguroval jsem i druhý ring, protože stroje jsou propojené přes dva nezávislé switche. Furt nic. Stále to vypadalo takto:

    Stack: corosync
    Current DC: gf (167904085) - partition with quorum
    Version: 1.1.12-2f2dcca
    6 Nodes configured
    0 Resources configured
    
    
    Online: [ ga gb gc gd ge gf gg ]
    

    A na stroji gg takto:

    Stack: corosync
    Current DC: gf (167904085) - partition with quorum
    Version: 1.1.12-2f2dcca
    1 Nodes configured
    0 Resources configured
    
    
    Online: [ gg ]
    

    Během nesčetných restartů jsem kontroloval logy, abych zjistil co se děje, ale nic jsem z nich nevykoukal. Při nahození nodu gg bylo vidět že tam nějaká komunikace probíhá a corosync se o něco snaží, ale nikam to nevedlo.

    Řešení..

    Večer už jsem byl z toho tak zoufalý, že jsem si říkal, zda-li není problém v uuid virtuálního switche. Ten totiž po naklonování zůstal stejný jako u stroje ga. Podobné klonování nodu jsem již v minulosti jednou absolvoval, když mi chcípnul disk v jednom z nodů clusteru Peanuts. Tehdy to proběhlo bez problémů, ovšem tenkrát jsem ještě openvswitch nepoužíval. Ovšem to vyžadovalo opět fyzickou přítomnost u stroje. Nechal jsem to tedy na ráno, až budu opět v práci.

    Po příchodu do kanclu už jsem byl odhodlán sejít dolů do serverovny, když tu mne napadla ještě jedna věc - co když jsem po výměně disku prohodil síťové kabely? Každá ze síťovek je sice zapojena do samostatného fyzického switche, ale co když při připojení přes ssh tcp pakety probublávají mezi sítěmi na nodu co dělá maškarádu? Komunikace corosyncu však probíhá přes udp a pro každý ring je jiný subnet a port. Pokud jsou kabely přehozené, logicky se pak gg s ostatními nody nedomluví.

    Otevřel jsem si tedy soubor /etc/udev/rules.d/70-persistent-net.rules, prohodil pojmenování síťových zařízení a nechal stroj restartovat.

    A voilá! Po obživnutí síťového připojení se nod gg objevil mezi ostatními nody, jako to má být..

    Malá, nezištná rada..

    Pokud by vám někdy bylo líto vyhodit nějaký - svého času skvělý, rychlý, drahý - disk, jen proto, že se občas chová divně. Tak si vzpomeňte na tenhle blogpost.

    Ledva jsem pořešil nod gg a začal konečně řešit co je třeba, vychcípnul disk v nodu ge. Naštěstí v btrfs raid6 poli, které jsem dosud nijak nevyužíval. A vzápětí pošel systémový disk v nodu gd. Bohužel podobným způsobem jako u gg, takže jsem dospěl k rozhodnutí pro jistotu všechny systémové disky nodů ze Schrotu přehodit na raid1, abych si ušetřil práci s klonováním.

    A ta rada? Pochybné disky bez milosti vyhodoďte, nebo věnujte někomu, kdo vám pije krev.

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    20.11.2014 13:20 Jirka
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Pěkné, pěkné. Jen nechápu jednu věc. Proč je pro změnu uuid virtuálního switche nutná fyzická přítomnost u stroje?
    20.11.2014 13:46 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Protože je to starý stroj, který nemá přístup přes ipmi, není připojený na KVM konzoli, nemá volný žádný interface přes který by bylo možné komunikovat při laborování s virtuálním switchem a nejspíš by bylo nutné přepíchnout i monitor a klávesnici z jiného stroje.
    20.11.2014 22:32 mimi.vx | skóre: 37 | blog: Mimi.VX | Praha
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    USE="-gnome -kde";turris
    20.11.2014 23:20 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Dík. Až budu mít vyřešené to co potřebuji a dost času na hraní se systemd, tak se na to určitě podívám. Ovšem vidím to tak nejdřív za rok a bůhví co a jak tou dobou bude. Třeba už budu taky v pánu - jako Ivan.
    23.11.2014 08:51 odin
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Kdyby mi do toho neco bylo, tak vam reknu, ze kdyz prestanete psat prispevky na soukromy blog v pracovni dobe, treba vam zbyde vice casu na praci.
    21.11.2014 12:34 David Jaša | skóre: 44 | blog: Dejvův blog
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Neumím totiž ovlivnit pořadí služeb, jsou-li nahazované přes systemd, což je u Pacemakeru docela podstatná věc.

    Dokud jsem měl nainstalován pouze balík systemd, bez balíku systemd-sysv, tak se systemd pokoušel spustit corosync a pacemaker, ještě před nahozením openvswitche.
    tak buď do openvswitch.service dáš Before=corosync.service pacemaker.service, nebo obráceně do corosync.service a pacemaker.service dáš Before=openvswitch.service, nebo pokud nosíš pásek i kšandy, tak dáš obojí.

    Ale spíš to vypadá jako postěžování si, než že bys to chtěl nějak řešit a nešlo to.
    21.11.2014 12:45 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Předpokládám, že jsi už narazil na můj poznatek v diskuzi pod předchozím blogpostem, že klíčový problém je v tom, že Debianu potřebná unita chybí. Pokud bych si ji ale chtěl napsat, tak bys mi ještě včera ráno tímto příspěvkem značně ulehčil práci, takže díky i za jiné čtenáře této diskuze, které jsi tímto nakopnul správným směrem.
    23.11.2014 08:32 odin
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Jak jinak, opet prispevek v pracovni dobe. At ziji statem financovane instituce!
    23.11.2014 09:46 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Copak? Vyfoukli vám kšeft?
    23.11.2014 14:06 odin
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Nevyfoukli. Obavam se, ze se ani zadna soutez konat nebude. O prinosnosti takoveho projektu radeji pomlcim, je to podle mne jen dalsi velky bratr a buzerace slusnych podnikatelu. Bude to asi tak stejne prinosne, jako existence statem financovanych vysokych skol se zamestnanci, kteri si v pracovni dobe pisi soukrome blogposty.
    23.11.2014 16:14 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Stále je ten přínos k obecnému prospěchu mnohonásobně vyšší, než ten váš.
    23.11.2014 18:01 odin
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    To je mozne, i kdyz si myslim, ze vy ani ja to posoudit nemuzeme. Vy ani nevite, cim se zivim, a ja si to netroufam odhadovat. Kazdopadne na smysluplnost jakehosi spolecensky agregovaneho prospechu jiz davno neverim. Je krasne, ze kazdy studuje zadarmo, ma zdarma zdravotni peci, a dokonce jsou financovany radoby vedecke instituce a projekty, ktere nemaji smysl, ale pokud bych toto obecne "blaho" mohl vymenit za snizeni dane z prijmu pravnickych osob nebo dph, menil bych to hned.
    24.11.2014 15:02 David Jaša | skóre: 44 | blog: Dejvův blog
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    To je mozne, i kdyz si myslim, ze vy ani ja to posoudit nemuzeme.
    Tak proč ho teda soudíš v každém svém příspěvku?
    24.11.2014 21:33 Odin
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Koho? Myslite pisatele blogpostu? Jak jej soudim? O jeho osobni prinosu, i kdybych vedel jak prinos definovat, jsem se nikdy nevyjadroval a nebudu. Jen se mi nelibi publikovani soukromych veci v pracovni dobe u zamestnance statem financovane instituce.
    24.11.2014 23:49 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Jen se mi nelibi publikovani soukromych veci v pracovni dobe u zamestnance statem financovane instituce.
    Podle hodnocení příspěvku soudě, že budete nejspíš sám, kdo tento blogpost považuje za ryze soukromou věc publikovanou v pracovní době. Nehledě na samotný fakt, že "pracovní doba" je v případě mého zaměstnání pojem poněkud vágní. Pokud za ni považujete pouhou přítomnost na pracovišti, tak by vaše ataky možná měly nějaké opodstatnění, ale já nejsem vrátný, sekretářka, nebo účetní co pracují od do.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.