abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 23:33 | Nová verze

    Google Chrome 125 byl prohlášen za stabilní. Nejnovější stabilní verze 125.0.6422.60 přináší řadu oprav a vylepšení (YouTube). Podrobný přehled v poznámkách k vydání. Opraveno bylo 9 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    včera 21:11 | Nová verze

    Textový editor Neovim byl vydán ve verzi 0.10 (𝕏). Přehled novinek v příspěvku na blogu a v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 20:55 | Nová verze

    Byla vydána nová verze 6.3 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Přehled změn v příslušném seznamu. Tor Browser byl povýšen na verzi 13.0.15.

    Ladislav Hagara | Komentářů: 0
    včera 13:33 | IT novinky

    Dnes ve 12:00 byla spuštěna první aukce domén .CZ. Zatím největší zájem je o dro.cz, kachnicka.cz, octavie.cz, uvycepu.cz a vnady.cz [𝕏].

    Ladislav Hagara | Komentářů: 2
    včera 13:22 | Nová verze

    JackTrip byl vydán ve verzi 2.3.0. Jedná se o multiplatformní open source software umožňující hudebníkům z různých částí světa společné hraní. JackTrip lze instalovat také z Flathubu.

    Ladislav Hagara | Komentářů: 0
    včera 12:22 | Pozvánky

    Patnáctý ročník ne-konference jOpenSpace se koná 4. – 6. října 2024 v Hotelu Antoň v Telči. Pro účast je potřeba vyplnit registrační formulář. Ne-konference neznamená, že se organizátorům nechce připravovat program, ale naopak dává prostor všem pozvaným, aby si program sami složili z toho nejzajímavějšího, čím se v poslední době zabývají nebo co je oslovilo. Obsah, který vytváří všichni účastníci, se skládá z desetiminutových

    … více »
    Zdenek H. | Komentářů: 0
    včera 03:11 | Nová verze

    Program pro generování 3D lidských postav MakeHuman (Wikipedie, GitHub) byl vydán ve verzi 1.3.0. Hlavní novinkou je výběr tvaru těla (body shapes).

    Ladislav Hagara | Komentářů: 5
    15.5. 23:11 | Bezpečnostní upozornění

    Intel vydal 41 upozornění na bezpečnostní chyby ve svých produktech. Současně vydal verzi 20240514 mikrokódů pro své procesory řešící INTEL-SA-01051, INTEL-SA-01052 a INTEL-SA-01036.

    Ladislav Hagara | Komentářů: 0
    15.5. 16:22 | IT novinky

    Společnost Raspberry Pi patřící nadaci Raspberry Pi chystá IPO a vstup na Londýnskou burzu.

    Ladislav Hagara | Komentářů: 0
    15.5. 13:22 | IT novinky

    Google na své vývojářské konferenci Google I/O 2024 představil řadu novinek. Keynote byl věnován umělé inteligenci (DeepMind, Gemini, Responsible AI).

    Ladislav Hagara | Komentářů: 2
    Podle hypotézy Mrtvý Internet mj. tvoří většinu online interakcí boti.
     (74%)
     (5%)
     (10%)
     (10%)
    Celkem 291 hlasů
     Komentářů: 16, poslední 14.5. 11:05
    Rozcestník

    Pacemaker - problém se integrací nodu

    20.11.2014 11:56 | Přečteno: 907× | Za vším hledej Linux | Výběrový blog | poslední úprava: 21.11.2014 12:57

    Poučné vyprávění o lapálii včerejšího podvečera

    Při aplikaci změn síťové konfigurace - viz včerejší blogpost na téma Jak skamarádit openvswitch a systemd, se ukázalo že onen pomyslný jásot byl poněkud předčasný. Neumím totiž ovlivnit pořadí služeb, jsou-li nahazované přes systemd, což je u Pacemakeru docela podstatná věc.

    Dokud jsem měl nainstalován pouze balík systemd, bez balíku systemd-sysv, tak se systemd pokoušel spustit corosync a pacemaker, ještě před nahozením openvswitche. To logicky končilo selháním, protože v tu dobu ještě rozhraní, přes které má probíhat komunikace corosyncu ještě neexistují.

    Po doinstalování balíku systemd-sysv byl výsledek ještě tristnější - k nahození virtuálních síťových rozhraní nedošlo vůbec. Možná by se to dalo pořešit přes obligátní:

    ..
        up ip link set $IFACE up
        down ip link set $IFACE down
    ..

    ..jenže to už mi začala docházet trpělivost.

    Nod gg, na kterém jsem s tím laboroval, se totiž začal chovat poněkud divně. Ačkoliv konfigurace sítě byla zcela identická jako u výchozího nodu ga - pochopitelně až na jiné adresy - síť po restartu nejprve naskočila pak škytla, spadla.. Po chvíli zase naskočila, pak zase spadla.. Při dalším naskočení jsem se přihlásil a zkusil systemd opět odinstalovat, jenže během této operace připojení upadlo definitivně. Nezbylo než dojít dolů do serverovny, zapíchnout monitor s klávesnicí a problém pořešit rovnou u stroje.

    Na monitoru byl kernel panic. Zmáčknul jsem reset a koukal co se bude dít - opět kernel panic. Zkusil jsem starší kernel. Zase kernel panic. To už mi bylo divné. Najel jsem do ramdisku. Namountoval systémový disk. Potud vše ok. Chci se přepnout přes chroot do systému a tu to na mne zařvalo input/output error a nic. Zkusím ls, find. Žádný problém. No koukal jsem na to jako blázen, tak jsem si přizval na pomoc kolegu, Pavla Píšu.

    Nebudu vás dále napínat. Ukázalo se, že systémový disk je na cestě do věčných lovišť a s vadnými sektory si ani Btrfs neporadí.

    Až potud žádný problém. Systém všech nodů je identický. Vykuchal jsem disk, místo něj vrazil nový na který jsem naklonoval po síti systém z nodu ga. Nabootoval systemrescuecd, skočil do chrootu, upravil hostname, síťovou konfiguraci, nakopíroval certifikáty puppetu a reinstaloval grub2.

    Jenže ouha! Systém najel, Puppet přeplácnul co měl, ale do clusteru se nod nezapojil. Co to?! No blbnul jsem s tím do dvou do rána, ovšem bezvýsledně. X krát jsem mazal konfiguraci i soubory které náleží ke corosyncu a pacemakeru. Kontroloval konfigurační soubory a nastavení práv - přičemž jsem odhalil i některé trapné chyby a překlepy. Ovšem stále nic. Nakonfiguroval jsem i druhý ring, protože stroje jsou propojené přes dva nezávislé switche. Furt nic. Stále to vypadalo takto:

    Stack: corosync
    Current DC: gf (167904085) - partition with quorum
    Version: 1.1.12-2f2dcca
    6 Nodes configured
    0 Resources configured
    
    
    Online: [ ga gb gc gd ge gf gg ]
    

    A na stroji gg takto:

    Stack: corosync
    Current DC: gf (167904085) - partition with quorum
    Version: 1.1.12-2f2dcca
    1 Nodes configured
    0 Resources configured
    
    
    Online: [ gg ]
    

    Během nesčetných restartů jsem kontroloval logy, abych zjistil co se děje, ale nic jsem z nich nevykoukal. Při nahození nodu gg bylo vidět že tam nějaká komunikace probíhá a corosync se o něco snaží, ale nikam to nevedlo.

    Řešení..

    Večer už jsem byl z toho tak zoufalý, že jsem si říkal, zda-li není problém v uuid virtuálního switche. Ten totiž po naklonování zůstal stejný jako u stroje ga. Podobné klonování nodu jsem již v minulosti jednou absolvoval, když mi chcípnul disk v jednom z nodů clusteru Peanuts. Tehdy to proběhlo bez problémů, ovšem tenkrát jsem ještě openvswitch nepoužíval. Ovšem to vyžadovalo opět fyzickou přítomnost u stroje. Nechal jsem to tedy na ráno, až budu opět v práci.

    Po příchodu do kanclu už jsem byl odhodlán sejít dolů do serverovny, když tu mne napadla ještě jedna věc - co když jsem po výměně disku prohodil síťové kabely? Každá ze síťovek je sice zapojena do samostatného fyzického switche, ale co když při připojení přes ssh tcp pakety probublávají mezi sítěmi na nodu co dělá maškarádu? Komunikace corosyncu však probíhá přes udp a pro každý ring je jiný subnet a port. Pokud jsou kabely přehozené, logicky se pak gg s ostatními nody nedomluví.

    Otevřel jsem si tedy soubor /etc/udev/rules.d/70-persistent-net.rules, prohodil pojmenování síťových zařízení a nechal stroj restartovat.

    A voilá! Po obživnutí síťového připojení se nod gg objevil mezi ostatními nody, jako to má být..

    Malá, nezištná rada..

    Pokud by vám někdy bylo líto vyhodit nějaký - svého času skvělý, rychlý, drahý - disk, jen proto, že se občas chová divně. Tak si vzpomeňte na tenhle blogpost.

    Ledva jsem pořešil nod gg a začal konečně řešit co je třeba, vychcípnul disk v nodu ge. Naštěstí v btrfs raid6 poli, které jsem dosud nijak nevyužíval. A vzápětí pošel systémový disk v nodu gd. Bohužel podobným způsobem jako u gg, takže jsem dospěl k rozhodnutí pro jistotu všechny systémové disky nodů ze Schrotu přehodit na raid1, abych si ušetřil práci s klonováním.

    A ta rada? Pochybné disky bez milosti vyhodoďte, nebo věnujte někomu, kdo vám pije krev.

           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    20.11.2014 13:20 Jirka
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Pěkné, pěkné. Jen nechápu jednu věc. Proč je pro změnu uuid virtuálního switche nutná fyzická přítomnost u stroje?
    20.11.2014 13:46 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Protože je to starý stroj, který nemá přístup přes ipmi, není připojený na KVM konzoli, nemá volný žádný interface přes který by bylo možné komunikovat při laborování s virtuálním switchem a nejspíš by bylo nutné přepíchnout i monitor a klávesnici z jiného stroje.
    20.11.2014 22:32 mimi.vx | skóre: 37 | blog: Mimi.VX | Praha
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    USE="-gnome -kde";turris
    20.11.2014 23:20 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Dík. Až budu mít vyřešené to co potřebuji a dost času na hraní se systemd, tak se na to určitě podívám. Ovšem vidím to tak nejdřív za rok a bůhví co a jak tou dobou bude. Třeba už budu taky v pánu - jako Ivan.
    23.11.2014 08:51 odin
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Kdyby mi do toho neco bylo, tak vam reknu, ze kdyz prestanete psat prispevky na soukromy blog v pracovni dobe, treba vam zbyde vice casu na praci.
    21.11.2014 12:34 David Jaša | skóre: 44 | blog: Dejvův blog
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Neumím totiž ovlivnit pořadí služeb, jsou-li nahazované přes systemd, což je u Pacemakeru docela podstatná věc.

    Dokud jsem měl nainstalován pouze balík systemd, bez balíku systemd-sysv, tak se systemd pokoušel spustit corosync a pacemaker, ještě před nahozením openvswitche.
    tak buď do openvswitch.service dáš Before=corosync.service pacemaker.service, nebo obráceně do corosync.service a pacemaker.service dáš Before=openvswitch.service, nebo pokud nosíš pásek i kšandy, tak dáš obojí.

    Ale spíš to vypadá jako postěžování si, než že bys to chtěl nějak řešit a nešlo to.
    21.11.2014 12:45 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Předpokládám, že jsi už narazil na můj poznatek v diskuzi pod předchozím blogpostem, že klíčový problém je v tom, že Debianu potřebná unita chybí. Pokud bych si ji ale chtěl napsat, tak bys mi ještě včera ráno tímto příspěvkem značně ulehčil práci, takže díky i za jiné čtenáře této diskuze, které jsi tímto nakopnul správným směrem.
    23.11.2014 08:32 odin
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Jak jinak, opet prispevek v pracovni dobe. At ziji statem financovane instituce!
    23.11.2014 09:46 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Copak? Vyfoukli vám kšeft?
    23.11.2014 14:06 odin
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Nevyfoukli. Obavam se, ze se ani zadna soutez konat nebude. O prinosnosti takoveho projektu radeji pomlcim, je to podle mne jen dalsi velky bratr a buzerace slusnych podnikatelu. Bude to asi tak stejne prinosne, jako existence statem financovanych vysokych skol se zamestnanci, kteri si v pracovni dobe pisi soukrome blogposty.
    23.11.2014 16:14 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Stále je ten přínos k obecnému prospěchu mnohonásobně vyšší, než ten váš.
    23.11.2014 18:01 odin
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    To je mozne, i kdyz si myslim, ze vy ani ja to posoudit nemuzeme. Vy ani nevite, cim se zivim, a ja si to netroufam odhadovat. Kazdopadne na smysluplnost jakehosi spolecensky agregovaneho prospechu jiz davno neverim. Je krasne, ze kazdy studuje zadarmo, ma zdarma zdravotni peci, a dokonce jsou financovany radoby vedecke instituce a projekty, ktere nemaji smysl, ale pokud bych toto obecne "blaho" mohl vymenit za snizeni dane z prijmu pravnickych osob nebo dph, menil bych to hned.
    24.11.2014 15:02 David Jaša | skóre: 44 | blog: Dejvův blog
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    To je mozne, i kdyz si myslim, ze vy ani ja to posoudit nemuzeme.
    Tak proč ho teda soudíš v každém svém příspěvku?
    24.11.2014 21:33 Odin
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Koho? Myslite pisatele blogpostu? Jak jej soudim? O jeho osobni prinosu, i kdybych vedel jak prinos definovat, jsem se nikdy nevyjadroval a nebudu. Jen se mi nelibi publikovani soukromych veci v pracovni dobe u zamestnance statem financovane instituce.
    24.11.2014 23:49 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
    Jen se mi nelibi publikovani soukromych veci v pracovni dobe u zamestnance statem financovane instituce.
    Podle hodnocení příspěvku soudě, že budete nejspíš sám, kdo tento blogpost považuje za ryze soukromou věc publikovanou v pracovní době. Nehledě na samotný fakt, že "pracovní doba" je v případě mého zaměstnání pojem poněkud vágní. Pokud za ni považujete pouhou přítomnost na pracovišti, tak by vaše ataky možná měly nějaké opodstatnění, ale já nejsem vrátný, sekretářka, nebo účetní co pracují od do.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.