Portál AbcLinuxu, 2. června 2024 16:52


Dotaz: httrack - kompletni kopie webu

1.2.2020 06:40 Petr
httrack - kompletni kopie webu
Přečteno: 307×
Odpovědět | Admin
Zdravim

Je jisty web, jehoz clanky jsou mi utechou i inspiraci. Vloni jeho autor prestal web udrzovat. Zanedlouho zjisti, ze ho domena a hosting stoji penize, a vsechno smaze

Rad bych si web zkopiroval pro svoji osobni potrebu. Je na nem necela stovka clanku a par desitek obrazku. Presto bych to chtel udelal nejak citlive

Urcite se do toho pustim v nocnich hodinach. Ale jeste me napadlo: nema httrack nejaky parametr, ktery by vkladal nahodne dlouhou prodlevu pred stazenim dalsiho souboru? V man strance jsem nenasel nic. Klidne to budu tahat pomalicku a tyden

Soubor robots.txt jsem v korenovem adresari webu nenasel, tak snad by se mohlo stahnout vsechno?

Jak byste postupovali vy?

Dekuji
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

1.2.2020 08:33 NN
Rozbalit Rozbalit vše Re: httrack - kompletni kopie webu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Podle manualu nema. Pouzil bych wget s parametrem -w(wait), nebo --random-wait.
1.2.2020 09:06 Petr
Rozbalit Rozbalit vše Re: httrack - kompletni kopie webu
Ahaa! Tak tam jsem ten parametr videl...

Diky!

To je muj odveky problem. Vzdycky upnu na jedno reseni a prestanu videt okolo

Google poradil tento postup:
wget --mirror \
     --convert-links \
     --adjust-extension \
     --page-requisites \
     --no-parent \
     --wait=30 \
     --random-wait \
     --execute robots=off \
       http://example.org
Jeste jednou diky a mejte se!
1.2.2020 09:13 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: httrack - kompletni kopie webu
Odpovědět | | Sbalit | Link | Blokovat | Admin
Radšej by som odporučil nakontaktovať sa na vlastníka/správcu daného webu, a prejednať to s ním. Ak je ten web totižto dynamicky generovaný, tak jeho mirroring môže vykonať paseku. Špeciálne, ak má spoplatnené využitie.
1.2.2020 09:29 Petr
Rozbalit Rozbalit vše Re: httrack - kompletni kopie webu
Dekuji

To je pravda. Nastesti ale to neni tenhle pripad

Jedna se pouze o staticke *.htm stranky. Podle pripony i zdrojaku jde poznat, ze borec je "ze stare skoly"

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.