Společnosti Ticketmaster byla odcizena databáze s osobními údaji (jméno, adresa, telefonní číslo a část platebních údajů) 560 miliónů zákazníku. Za odcizením stojí skupina ShinyHunters a za nezveřejnění této databáze požaduje 500 tisíc dolarů [BBC].
Byla vydána nová stabilní verze 24.05 linuxové distribuce NixOS (Wikipedie). Její kódové označení je Uakari. Podrobný přehled novinek v poznámkách k vydání. O balíčky se v NixOS stará správce balíčků Nix.
Byla vydána nová verze 1.48.0 sady nástrojů pro správu síťových připojení NetworkManager. Novinkám se v příspěvku na blogu NetworkManageru věnuje Fernando F. Mancera. Mimo jiné se v nastavení místo mac-address-blacklist nově používá mac-address-denylist.
Před 25 lety, 31. května 1999, započal vývoj grafického editoru Krita (Wikipedie). Tenkrát ještě pod názvem KImageShop a později pod názvem Krayon.
Farid Abdelnour se v příspěvku na blogu rozepsal o novinkám v nejnovější verzi 24.05.0 editoru videa Kdenlive (Wikipedie). Ke stažení brzy také na Flathubu.
David Revoy, autor mj. komiksu Pepper&Carrot, se rozepsal o své aktuální grafické pracovní stanici: Debian 12 Bookworm, okenní systém X11, KDE Plasma 5.27, …
Wayland (Wikipedie) byl vydán ve verzi 1.23.0. Z novinek lze vypíchnout podporu OpenBSD.
Craig Loewen na blogu Microsoftu představil novinky ve Windows Subsystému pro Linux (WSL). Vypíchnout lze GUI aplikaci pro nastavování WSL nebo správu WSL z Dev Home.
V sobotu 1. června lze navštívit Maker Faire Ostrava, festival plný workshopů, interaktivních činností a především nadšených a zvídavých lidí.
Webový server Caddy (Wikipedie) s celou řadou zajímavých vlastností byl vydán ve verzi 2.8 (𝕏). Přehled novinek na GitHubu.
Ahojte vsichni.
Mam nekolik odkazu:
<a href="/dafuq/lol/1/">1</a>
<a href="/dafuq/lol/2/">2</a>
<a href="/dafuq/lol/3/">3</a>
<a href="/dafuq/lol/4/">...</a>
<a href="/dafuq/lol/8/">8</a>
<a href="/dafuq/lol/9/">9</a>
Potrebuju z nich dostat tu cislovku na konci odkazu (napr. <a href="/dafuq/lol/9/">9</a>) pomoci regularniho vyrazu. Jak to mam udelat? Regexy mi vubec, vubec nejdou. Predem diky za pomoc
Řešení dotazu:
Uz jsem to vyresil
<a href="/dafuq/[^/]*/([^/\"]*)/">[^<>/]*</a>
xmllint
. Ta umí parsovat HTML o něco lépe.
for $x in doc("input.html")//a return substring-before(substring-after($x/@href, 'lol/'), '/')Možná to nevypadá tak elegantně jako regexp, ale poradí si to i s více odkazy na řádku, zalomenými atributy, komentáři...
lynx -dump -listonly -nonumbers http://abclinuxu.cz/Na vytáhnutí odkazů z HTML to je velice praktické. Pak už ty regulární výrazy lze použít snadno.
Na parsování HTML bych doporučil nástroje k tomu určené a ne regulární výrazy.
$ vim get_a_href.py #! /usr/bin/env python # -*- coding: utf-8 -*- import sys from lxml.html import parse if (len(sys.argv) != 2): print "Usage: %s FILENAME or URL" % sys.argv[0] sys.exit() page = parse(sys.argv[1]) urls = page.xpath('//a/@href') for url in urls: print url $ chmod +x get_a_href.py
<html> <a href="/dafuq/lol/1/">1</a> <a href="/dafuq/lol/2/">2</a> <a href="/dafuq/lol/3/">3</a> <a href="/dafuq/lol/4/">4</a> <a href="/dafuq/lol/5/">5</a> <a href="/dafuq/lol/6/">6</a> <a href="/dafuq/lol/7/">7</a> <a href="/dafuq/lol/8/">8</a> <a href="/dafuq/lol/9/">9</a> </html>Lze všechny URL získat takto:
xpath -q -e '//a/@href' soubor.xmlVýsledek:
href="/dafuq/lol/1/" href="/dafuq/lol/2/" href="/dafuq/lol/3/" href="/dafuq/lol/4/" href="/dafuq/lol/5/" href="/dafuq/lol/6/" href="/dafuq/lol/7/" href="/dafuq/lol/8/" href="/dafuq/lol/9/"
/dafuq/lol/1/ /dafuq/lol/2/ /dafuq/lol/3/ /dafuq/lol/4/ /dafuq/lol/8/ /dafuq/lol/9/nebo
1, 2, 3, 4, 8, 9jinak než sedem? Obvykle používám xsltproc, což je na některé drobnosti zbytečně těžký kalibr. Na jednodušší věci momentálně používám program xqilla, ale úplně mi nesedí.
xpath
vyměnit volání metody toString
za getNodeValue
a případně dál upravit dle potřeby.
#!/usr/bin/perl -w use XML::XPath; $xpath = XML::XPath->new(ioref => \*STDIN); my $names = $xpath->find('//a/@href'); for my $node ($names->get_nodelist) { $_ = $node->getNodeValue; s|^.*/([^/]*)/$|$1|; print $_, "\n"; }A to je celé. Volby jsou pryč, vstupem je STDIN. Dělá to jen to, co chce tazatel, ale přímo z HTML.
Tiskni Sdílej: