Portál AbcLinuxu, 6. června 2024 09:16


Dotaz: Nefunkční server po obnově dat

25.9.2023 20:43 pecka33
Nefunkční server po obnově dat
Přečteno: 466×
Odpovědět | Admin
Dobrý den,

mám problém. Nevím jestli někdo znáte ispconfig, ale provozuji ho na serveru debian 2 roky bez problémů. Poslední verze debianu, ispconfigu atd., Vše bylo až do včera funkční. Problém nastal v ispconfig, ten provádí automatické zálohy, takže jsem myslel, že vše vyřeší obnova dat toho ispconfig - je v něm usr/local/ispconfig, pak acme pro certifikáty a obsah adresáře /etc

Tedy vše jsem nahrál na server, udělal reboot a server už nenajede. Resp. se dostanu do konzole přes ILO, i k rootu, ale dál aby byl server ne. Přes journal vidím chyby typu acpi bios warning bug indalid lenght for FADT/Pm2controlblock 32 using default 8 and 16 and 32/64x lenght mismatch in fadt

když si dám server failed status, vidím jednu službu failed a to systemmd/fsckdev/disk/bz/x2uuid.....service ¨ Nemáte prosím někdo zkušenosti čím to může být, jak opravit? Děkuji.
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

25.9.2023 21:49 X
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Odpovědět | | Sbalit | Link | Blokovat | Admin
To je zmatek. Takze znovu a po poradku. Popisujes, ze jsi provadel obnovu dat. Proc? Co se stalo? Co jsi resil? Dostanes se do konzole => server najede. Mas nejake zkusenosti s prikazovou radkou(procesy, sluzby, logy etc.)?
25.9.2023 22:16 pecka33
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Nějaké ano, spravuji server s ispconfigrém a debianem několik let. Ted se po zásahu přes ispconfig v apache něco pokazilo a nešel nastartovat, tak jsem udělal obnovu dat ispconfig a jeho databáze pár dní zpět když ještě vše šlo a například toto vidím čistě po startu

https://i.ibb.co/yXTfx7J/IMG-1224.jpg

Journal log pak https://img.onl/Qsd4Hd

Predtim jsem v apache logu nic nenasel co bz mohlo dany problem zpusobit a tak jsem zkusil obnovu
25.9.2023 23:17 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Koukl ses alespoň do některého z těch logů?
26.9.2023 00:37 X
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
To ACPI je nejaky sekundarni HW problem. To prvni je vaznejsi a hadam nenajela nejaka sluzba. Co vsechno bezi(ps ax, netstat -an). Bezi databaze? Bezi web server? Co logy v /var/log? Co rika 'dmesg' na konci?
26.9.2023 10:47 pecka33
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Dekuji vsem za rady. Bojuji s tim celou noc, vse jsem porovnaval. Nevidim rozdil napr. ve fstab z doby kdy to slo v poradku a z te zalohy. Kdyz si ale dam df h, vidim ze jeden disk pripojeny chybi oproti tomu co tam byl drive a nevim proc. Zkusil jsem mount manualne, pak jsem ho v df mezi disky videl, ale po rebookut zmizel. Pritom fstab stale stejny. Jeste jsem ho upravil, pridal jsem nejake dalsi cesty k adresarum, ktere chybely.

Standardne mam dva disky, kazdy o velikost 1 TB. Jeden sda smeruji do / a druhy sdb1 smerujici do /var. Neptejte se proc to je takhle zlastne.

Rekl bych, ze problem bude v tomhle. Jenze netusim kde, zkousel jsem uz vsechno mozne, mam na tom nejake weby klientu a celkem to hori, jenze neznam nikoho v tomto oboru co by na to koukl. Nekdo mi rikal, ze muze byt pry disk ko, ale to se mi nezda, zapis na disk i nacitani je ok.

Nevim jestli nekdo znate system ISPCONFIG. Mam nejnovejsi verzi, nekolik let vcetne debianu. Vzdy bylo vse ok. Bohuzel se delaly v ispconfig diky klientovi nejake zmeny v apache a spadlo to. Zkousel jsem vse. Vzdy po jednom rebootu sluzby nabehly, ale nefungoval z nejakeho duvodu port8080, po dalsim rebootu byly failed sluzby jako clamav a php 5.6-.8.2, nekdy dole jen jedno php. Kdy jsem vse opravil a nic nebylo failed, stale to neslo.

Tak jsem se rozhodl pro obnovu dat. ISPCONFIG provadi pravidelne zalohy dat, konkretne acme pro lets encrypt, cely adresar ispconfigu a pak cely adresar /etc vcetne cele konfigurace.

Vzal jsem tedy vcerejsi zalohu ze 13. hodiny, kdy bylo vse ok, nahral ji, udelal reboot a od te doby se server zacal chovat zvlastne az to cele zkolabovalo. Logy jsem prochazel nekolikrat, ale nikdy mi server takhle nespadl a uz jsem bezradny.

Nejhorsi jeste je, ze se ke sprave serveru ted dostanu jen pres HPE ilo panel, a funguje znacne omezene, z hlediska rychlosti, hrozne pomaly.

Po rebootu vidim to vyse uvedene, fstab stale totozny, ale kdyz dam df h, ten disk pro /var co tam byl drive tam ted nevidim. I po mountu a restartu zase zmizi.

Sit pravdepodobne taky tedy nejed, pres klasicke putty se tam nedostanu a dig neodpovida / hostitel nenalezen.

Tohle jsou logy co se mi podarilo ziskat.

https://ibb.co/NnsHpqg https://ibb.co/2qfwvPN https://ibb.co/kqpv6YT https://ibb.co/F4m3Y7r https://ibb.co/QnGF0HT https://ibb.co/R0Yg1Wj https://ibb.co/2cmmH58 https://ibb.co/sm7BQD2 https://ibb.co/bNm1RKH https://ibb.co/rmscshP

Vypada to na problem s tim diskem, treba kdyz si dam tail a chci zobrazit var/log/syslog, pise, ze pry neexistuje.

Dekuji vsem za tipy.
26.9.2023 11:23 X
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Hlavne to bootuje do servisniho rezimu ktery je znacne omezeny. Zkontroloval bych cely ten proces = boot, kernel, disky.
26.9.2023 11:30 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
A čo tak skontrolovať pomocou nejakého fsck ten disk čo sa sám nepripojí do /var ? To by bol dôvod prečo neštartuje apache (obvykle hosťuje z /var/www) a možno aj nejaká DB.

Možno len prišlo k jeho nekorektnému odpojeniu (násilný reset stroja), a je tak veľký že mu automatický fsck pri štarte nedobehne za obligátnu 1.5 min a tým pádom sa nepripojí. Ale to len hádam. Normálne sa také niečo zobrazuje pri štarte systému, alebo je to vidno v žurnále (ktorý je treba pozrieť celý, nielen pár riadkov zo štartu jadra).
26.9.2023 11:41 pecka33
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Děkuji moc, zkusim proverit. Jen uz nevim vlastne kde, zkousel jsem zapis na disk atd., a vse proslo, kontroloval fstab zda je vse ok, souhlasi presne s tim, ktery na serveru byl kdyz vse fungovalo.

Vlastne jedine co me napada, nekdy predevcirem jsem delal pres konzoli import velke DB, cca 1,1 GB a mam pocit, ze se to trochu seklo,takze jsem daval reboot, pak celou db smazal, vytvoril novou, udelal import znovu a proslo to. Otazka jestli nemohl nastat tady nekde problem. Sice pak vse fungovalo ok, vsechny sluzby, ale po dalsim rebootu se zacaly projevovat uz takove chyby.
26.9.2023 11:54 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Že oblíbený feature systemd aka chybějící nofail ve fstabu?
26.9.2023 11:58 pecka33
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Tak opraveno!Tedy alespon jedna cast, uz se dostanu pres putty, server nastartuje v pohode plus se nactou sluzby jako postfix, mysql a dalsi. Krome apache apod. To hlasi pri failed vypisu [code]> ● clamav-clamonacc.service loaded failed failed ClamAV On-Access Scanner ● named.service loaded failed failed BIND Domain Name Server ● php7.3-fpm.service loaded failed failed The PHP 7.3 FastCGI Process Ma> ● php7.4-fpm.service loaded failed failed The PHP 7.4 FastCGI Process Ma> ● php8.1-fpm.service loaded failed failed The PHP 8.1 FastCGI Process Ma> ● redis-server.service loaded failed failed Advanced key-value store ● roundcube-cleandb.service loaded failed failed Purge Roundcube database: remo>

LOAD = Reflects whether the unit definition was properly loaded. ACTIVE = The high-level unit activation state, i.e. generalization of SUB. SUB = The low-level unit activation state, values depend on unit type. 7 loaded units listed. [/code]

Mozna by pomohl reinstall php, ale o data jsem nastesti neprisel.
26.9.2023 12:00 pecka33
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Oprava prikazem sudo fsck -y /dev/disk, co byl pripojeny, pak se nahodil po rebootu i druhy.
26.9.2023 15:29 pecka33
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Dobrý den,

ještě jedna prosba.

Zdravím,

po rebootu serveru, který se mi podařilo včetně dat zachránit se mi nechce nastartovat služba zajišťující provoz v online síti a tou je bind - named.service. Podle systemctl status named.service je chyba

[code]× named.service - BIND Domain Name Server Loaded: loaded (/lib/systemd/system/named.service; enabled; preset: enable> Active: failed (Result: exit-code) since Tue 2023-09-26 15:10:08 CEST; 2s > Docs: man:named(8) Process: 22224 ExecStart=/usr/sbin/named -f $OPTIONS (code=exited, status=1> Main PID: 22224 (code=exited, status=1/FAILURE) CPU: 24ms

Sep 26 15:10:08 systemd[1]: named.service: Scheduled restart job, rest> Sep 26 15:10:08 systemd[1]: Stopped named.service - BIND Domain Name S> Sep 26 15:10:08 systemd[1]: named.service: Start request repeated too > Sep 26 15:10:08 systemd[1]: named.service: Failed with result 'exit-co> Sep 26 15:10:08 systemd[1]: Failed to start named.service - BIND Domai> lines 1-13/13 (END)...skipping... × named.service - BIND Domain Name Server Loaded: loaded (/lib/systemd/system/named.service; enabled; preset: enabled) Active: failed (Result: exit-code) since Tue 2023-09-26 15:10:08 CEST; 2s ago Docs: man:named(8) Process: 22224 ExecStart=/usr/sbin/named -f $OPTIONS (code=exited, status=1/FAILURE) Main PID: 22224 (code=exited, status=1/FAILURE) CPU: 24ms Sep 26 15:10:08 systemd[1]: named.service: Scheduled restart job, restart counter is at 5. Sep 26 15:10:08 systemd[1]: Stopped named.service - BIND Domain Name Server. Sep 26 15:10:08 systemd[1]: named.service: Start request repeated too quickly. Sep 26 15:10:08 systemd[1]: named.service: Failed with result 'exit-code'. Sep 26 15:10:08 systemd[1]: Failed to start named.service - BIND Domain Name Server. [/code]

Ale vůbec nevím, kde hledat. Mám sice na serveru nastavení nameservery - ispconfigu, ale všechno běželo i bez toho, doménu mám klasicky u wedosu a jen směruji DNS záznamy na server plus mám v ispconfigu doménu založenou v DNS systému.

Teď proto, že server není v síti nefunguje nic co se týká sítě, update dat z debian stránky, něco stáhnout z url adresy, dig nic nevrací apod.

Kontroloval jsem vše v etc, networking, hosts soubory, vše co jde. Nemůžu na nic přijít, protože od rebootu kdy vše fungovalo se v tomhle směru nic nedělo, až teď najednou nechtějí služby najet. Lokálně se zdá, že by to i fungovalo, resp. využívám na serveru ssl. Když dám nějakou doménu bez https, zobrazí se klasická stránka apache2 debian default. Problém je pak třeba když chci přistupovat k webu s https, do konfigu pres domena.cz:8080 atd.

Měl jsem podezření na nefunkční porty, ale to se nepotvrdilo. Kromě toho nechce nastartovat nějaká řada PHP v apache, clamav...ale to bude nejspíše symlinkama co jsem zjistil. Teď řeším hlavně výše uvedené. Syslog mi taky nic moc nepomáhá, jen

[code]2023-09-26T15:15:05.477091+02:00 ntpd[908]: DNS: dns_probe: 1.debian.pool.ntp.org, cast_flags:8, flags:101 2023-09-26T15:15:05.477466+02:00 ntpd[908]: DNS: dns_check: processing 1.debian.pool.ntp.org, 8, 101 2023-09-26T15:15:05.477532+02:00 ntpd[908]: DNS: dns_check: DNS error: -3, Temporary failure in name resolution 2023-09-26T15:15:05.477586+02:00 ntpd[908]: DNS: dns_take_status: 1.debian.pool.ntp.org=>temp, 3 2023-09-26T15:15:06.477090+02:00 ntpd[908]: DNS: dns_probe: 2.debian.pool.ntp.org, cast_flags:8, flags:101 2023-09-26T15:15:06.477483+02:00 ntpd[908]: DNS: dns_check: processing 2.debian.pool.ntp.org, 8, 101 2023-09-26T15:15:06.477553+02:00 ntpd[908]: DNS: dns_check: DNS error: -3, Temporary failure in name resolution 2023-09-26T15:15:06.477604+02:00 ntpd[908]: DNS: dns_take_status: 2.debian.pool.ntp.org=>temp, 3 2023-09-26T15:15:07.477138+02:00 ntpd[908]: DNS: dns_probe: 3.debian.pool.ntp.org, cast_flags:8, flags:101 2023-09-26T15:15:07.477537+02:00 ntpd[908]: DNS: dns_check: processing 3.debian.pool.ntp.org, 8, 101 2023-09-26T15:15:07.477608+02:00 ntpd[908]: DNS: dns_check: DNS error: -3, Temporary failure in name resolution 2023-09-26T15:15:07.477659+02:00 ntpd[908]: DNS: dns_take_status: 3.debian.pool.ntp.org=>temp, 3 [/code]

Přes dig @localhost domena.cz vrátí jen no servers could be reached.

Dál moc nevím co bych měl tak prověřit, ale z toho co jsem našel mi nic moc nepomohlo. Nějaké nápady?

Děkuji moc.

26.9.2023 16:09 Aleš Kapica | skóre: 51 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Zkontroluj si co máš v souboru /etc/resolv.conf, jestli je tam to co tam má být. A nauč se používat značku pre.
26.9.2023 16:36 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Logicky když ti neběží dnsko, nic vyžadující překlad adres nepojede. Všechny ty logy jsou o tom.

Musíš zjistit, proč ti neběží a rozchodit ho, pokud je potřebuješ. Pokud ne, rovnou dej do /etc/resolv.conf to zmiňované googlí DNS 8.8.8.8. Ale to je workaround, chce to zjistit, v čem je skutečně problém.

Klidně můžeš mít nakopnutý filesystém a binárka je třeba poškozená. Nebo ti fsck přesunul do /lost+find nakopnutý soubor, třeba některý z konfiguráků atd. Podívat se do logů, zkusit binárku spustit napřímo v terminálu (bez omáčky systemd kolem), atd.
26.9.2023 16:29 SpFred
Rozbalit Rozbalit vše Re: Nefunkční server po obnově dat
Odpovědět | | Sbalit | Link | Blokovat | Admin
Mozno neco s tymto: https://phoenixnap.com/kb/temporary-failure-in-name-resolution

skus pignut adresu nameservera z v /etc/resolv.conf ... zmenit pokusne nameserver v /etc/resolv.conf na (nameserver 8.8.8.8)a skusit ci sa neco zmeni po restarte

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.