abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 17:00 | IT novinky

    Společnost AMD na veletrhu Computex 2024 představila (YouTube) mimo jiné nové série procesorů pro desktopy AMD Ryzen 9000 a notebooky AMD Ryzen AI 300.

    Ladislav Hagara | Komentářů: 0
    včera 16:22 | Nová verze

    OpenCV (Open Source Computer Vision, Wikipedie), tj. open source multiplatformní knihovna pro zpracování obrazu a počítačové vidění, byla vydána ve verzi 4.10.0 . Přehled novinek v ChangeLogu. Vypíchnout lze Wayland backend pro Linux.

    Ladislav Hagara | Komentářů: 0
    včera 14:00 | Zajímavý software

    Národní superpočítačové centrum IT4Innovations s partnery projektu EVEREST vydalo sadu open source vývojových nástrojů EVEREST SDK pro jednodušší nasazení aplikací na heterogenních vysoce výkonných cloudových infrastrukturách, zejména pro prostředí nabízející akceleraci pomocí FPGA.

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | IT novinky

    Společnost Valve aktualizovala přehled o hardwarovém a softwarovém vybavení uživatelů služby Steam. Podíl uživatelů Linuxu aktuálně činí 2,32 %. Nejčastěji používané linuxové distribuce jsou Arch Linux, Ubuntu, Linux Mint a Manjaro Linux. Při výběru jenom Linuxu vede SteamOS Holo s 45,34 %. Procesor AMD používá 75,04 % hráčů na Linuxu.

    Ladislav Hagara | Komentářů: 6
    včera 11:33 | Pozvánky

    Blíží se léto, chladiče topí, tranzistory se přehřívají, novinářům pomalu docházejí témata a nastává klasická okurková sezóna. Je tomu tak i mezi bastlíři? Na to se podíváme na Virtuální Bastlírně! Tentokrát se strahováci podívají na zoubek velmi slibně vypadajícímu open-source EDM projektu - ne, nejde o taneční hudbu, ale o elektroobrábění. Ukáží taky, jak vypadá starší cykloradar zevnitř nebo jak se testuje odolnost iPhonů.

    … více »
    bkralik | Komentářů: 0
    včera 11:22 | Humor

    CEO Microsoftu Satya Nadella odstoupil z představenstva Starbucks [CNBC, SEC].

    Ladislav Hagara | Komentářů: 1
    2.6. 16:22 | Upozornění

    Společnosti Ticketmaster byla odcizena databáze s osobními údaji (jméno, adresa, telefonní číslo a část platebních údajů) 560 miliónů zákazníku. Za odcizením stojí skupina ShinyHunters a za nezveřejnění této databáze požaduje 500 tisíc dolarů [BBC].

    Ladislav Hagara | Komentářů: 19
    31.5. 23:55 | Nová verze

    Byla vydána nová stabilní verze 24.05 linuxové distribuce NixOS (Wikipedie). Její kódové označení je Uakari. Podrobný přehled novinek v poznámkách k vydání. O balíčky se v NixOS stará správce balíčků Nix.

    Ladislav Hagara | Komentářů: 0
    31.5. 17:33 | Nová verze

    Byla vydána nová verze 1.48.0 sady nástrojů pro správu síťových připojení NetworkManager. Novinkám se v příspěvku na blogu NetworkManageru věnuje Fernando F. Mancera. Mimo jiné se v nastavení místo mac-address-blacklist nově používá mac-address-denylist.

    Ladislav Hagara | Komentářů: 32
    31.5. 17:11 | Komunita

    Před 25 lety, 31. května 1999, započal vývoj grafického editoru Krita (Wikipedie). Tenkrát ještě pod názvem KImageShop a později pod názvem Krayon.

    Ladislav Hagara | Komentářů: 9
    Rozcestník

    Administrace komentářů

    Jste na stránce určené pro řešení chyb a problémů týkajících se diskusí a komentářů. Můžete zde našim administrátorům reportovat špatně zařazenou či duplicitní diskusi, vulgární či osočující příspěvek a podobně. Děkujeme vám za vaši pomoc, více očí více vidí, společně můžeme udržet vysokou kvalitu AbcLinuxu.cz.

    Příspěvek
    11.6.2022 13:30 hermes | skóre: 6 | blog: Elektro | BA
    Rozbalit Rozbalit vše C++ - AI a mining adries firiem
    Ahojte mám taký nástroj, ktorý prejde niektoré stránky so zoznamami firiem napr.
    1. https://www.zoznam.sk/katalog/Spravodajstvo-informacie/Abecedny-zoznam-firiem/
    2. https://www.azet.sk/katalog/

    a nahodí firmy štruktúrovane do mojej SQL databázy. Nahadzuje ich podľa:

    krajina / kraj / mesto / firma

    Každá položka oobsahuje:

    1. Názov firmy
    2. Adresu
    3. Kontaktné údaje (tel, email)

    S mojou SQL DB potom môžem ďalej pracovať a používať tento zoznam firiem v mojich aplikáciách. Problém je, že som odkázaný len na hotové weby s katalógom firiem. A vždy pre každý nový katalóg musím pripraviť šablónu, podľa ktorej sa budú dáta minovať.

    Napadlo ma urobiť univerzálnejšie riešenie. Ktoré by fungovalo na akékoľvek weby. Nejakou heurestikou by sa mohla detegovať adresa. Adresa by sa dala nájsť podľa nejakého klúča. V adrese sú prítomné:

    1. Meno fyzickej osoby / Názov firmy (právnická osoba) - v niektorých prípadoch viem detegovať (ak je na konci názvu s.r.o. alebo a.s. inak neviem ako by som to detegoval)
    2. Ulica Číslo - viem detegovať regexom aj keď asi nie na 100%
    3. Mesto - viem detegovať podľa nejakého zoznamu miest (informácia o meste mi dáva aj ďalešie info o kraji a krajine)
    4. PSČ - viem detegovať regexom
    5. EMAIL(y) - viem detegovať regexom
    6. Telefón(y) - viem detegovať regexom

    Možno by bolo fajn detgovať aj logo firmy a uložiť ho do DB ako blob, ale to asi zatiaľ vynechám a budem sa tomu venovať až na záver, lebo ma nenapadá spôsob ako na to

    Rozmýšlam ako spraviť na jednej strane čo najpresnejšie a zároveň najuniverzálenejšie riešenie. Prechádzanie stránok, by fungovalo podobne ako pri google bote cez odkazy. To neni problém a viem si s tým ľahko poradiť. Ale ako na detekciu názvu firmy a jej adresy? Nedal by sa na detekciu použiť strojové učenie. Pozeral som si kedysi nejaké tutorialy pre technológiu CUDA a tam bolo dosť veľa deep learning frameworkov, neviete s ktorým začať niečo čo by bolo vhodné aj pre začiatočníka? Najlepšie nejaký framework pre C++

    V tomto formuláři můžete formulovat svou stížnost ohledně příspěvku. Nejprve vyberte typ akce, kterou navrhujete provést s diskusí či příspěvkem. Potom do textového pole napište důvody, proč by měli admini provést vaši žádost, problém nemusí být patrný na první pohled. Odkaz na příspěvek bude přidán automaticky.

    Vaše jméno
    Váš email
    Typ požadavku
    Slovní popis
    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.