Přihlášení | Registrace

napište » Zprávičky

včera 23:55 | Nová verze

Byla vydána nová stabilní verze 24.05 linuxové distribuce NixOS (Wikipedie). Její kódové označení je Uakari. Podrobný přehled novinek v poznámkách k vydání. O balíčky se v NixOS stará správce balíčků Nix.

Ladislav Hagara | Komentářů: 0

NetworkManager 1.48.0

včera 17:33 | Nová verze

Byla vydána nová verze 1.48.0 sady nástrojů pro správu síťových připojení NetworkManager. Novinkám se v příspěvku na blogu NetworkManageru věnuje Fernando F. Mancera. Mimo jiné se v nastavení místo mac-address-blacklist nově používá mac-address-denylist.

Ladislav Hagara | Komentářů: 8

25 let Krity

včera 17:11 | Komunita

Před 25 lety, 31. května 1999, započal vývoj grafického editoru Krita (Wikipedie). Tenkrát ještě pod názvem KImageShop a později pod názvem Krayon.

Ladislav Hagara | Komentářů: 3

Novinky v Kdenlive 24.05.0

včera 12:55 | Nová verze

Farid Abdelnour se v příspěvku na blogu rozepsal o novinkám v nejnovější verzi 24.05.0 editoru videa Kdenlive (Wikipedie). Ke stažení brzy také na Flathubu.

Ladislav Hagara | Komentářů: 0

David Revoy: aktuální grafická pracovní stanice

včera 11:22 | Zajímavý článek

David Revoy, autor mj. komiksu Pepper&Carrot, se rozepsal o své aktuální grafické pracovní stanici: Debian 12 Bookworm, okenní systém X11, KDE Plasma 5.27, …

Ladislav Hagara | Komentářů: 7

Wayland 1.23.0

30.5. 22:44 | Nová verze

Wayland (Wikipedie) byl vydán ve verzi 1.23.0. Z novinek lze vypíchnout podporu OpenBSD.

Ladislav Hagara | Komentářů: 0

Novinky ve Windows Subsystému pro Linux (05/2024)

30.5. 21:22 | Zajímavý článek

Craig Loewen na blogu Microsoftu představil novinky ve Windows Subsystému pro Linux (WSL). Vypíchnout lze GUI aplikaci pro nastavování WSL nebo správu WSL z Dev Home.

Ladislav Hagara | Komentářů: 0

Maker Faire Ostrava

30.5. 12:44 | Pozvánky

V sobotu 1. června lze navštívit Maker Faire Ostrava, festival plný workshopů, interaktivních činností a především nadšených a zvídavých lidí.

Ladislav Hagara | Komentářů: 0

Caddy 2.8

30.5. 12:22 | Nová verze

Webový server Caddy (Wikipedie) s celou řadou zajímavých vlastností byl vydán ve verzi 2.8 (𝕏). Přehled novinek na GitHubu.

Ladislav Hagara | Komentářů: 13

HAProxy 3.0

29.5. 22:11 | Nová verze

Byla vydána verze 3.0 (@, 𝕏) svobodného softwaru HAProxy (The Reliable, High Performance TCP/HTTP Load Balancer; Wikipedie) řešícího vysokou dostupnost, vyvažování zátěže a reverzní proxy. Detailní přehled novinek v příspěvku na blogu společnosti HAProxy Technologies.

Ladislav Hagara | Komentářů: 7

Centrum | Napsat | Starší

navrhněte » Anketa

Podle hypotézy Mrtvý Internet mj. tvoří většinu online interakcí boti.

Jsem bot. (90%)

Jsem člověk. (3%)

Opravdu jsem člověk! (4%)

Jsem něco jiného. (4%)

Celkem 1071 hlasů

Komentářů: 17, poslední včera 15:31

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Databázová poradna / PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč

Štítky: databáze

Dotaz: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč

8.1.2020 13:29 Aleš Janda | skóre: 23 | blog: kýblův blog | Praha
PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč

Přečteno: 2094×

Odpovědět | Admin

Chtěl bych se zeptat, jak nejlépe navrhnout databázi pro toto:

V tabulce mám řádky, které jsou výsledkem nějakého postupného bádání. Jak bádání pokračuje, můžou být některé řádky zastaralé a nahrazeny jinými řádky. Například mám řádky A, B a C a nějakým algoritmem řeknu „z řádků A a C vyplývá nějaká nová informace D“, a nahradím řádky A a C jedním řádkem D (nebo i více řádky). Z řádků B a D třeba vyplyne něco dalšího, tak je nahradím řádkem E.

No jo, ale občas si řeknu „tenhle algoritmus byl blbost“, smažu všechny řádky vyrobené tímto algoritmem, a měly by se smazat všechny řádky vyrobené tímto algoritmem, ale i všechny řádky, které vznikly na jejich základě. Například když smažu D, smaže se i E (a zase budou platné A, B a C).

Na tohle můžu použít cizí klíč (foreign key) s ON DELETE CASCADE.

No jo, ale jak efektivně hledat na aktuálními daty? Tedy nad daty, které nejsou referencovány jinými řádky (resp. nebyly překryty nějakým dalším algoritmem)? Jediné řešení, co jsem našel, je použít LEFT JOIN přes všechny řádky, ale to mi přijde strašně neefektivní; potřebuju jenom poslední verzi řádků (hodněkrát), a ty překryté jenom když se vracím k předchozím verzím (málokdy).

Je tedy nějaký způsob indexu „tento řádek je indexován jiným“? Nebo celá ta úvaha je nesmyslná a měl bych to udělat jinak?

Dělám v PostgreSQL.

Díky.

Zahrajte si trojšachy přes internet :-)

Nástroje: Začni sledovat (1) ?

Odpovědi

8.1.2020 14:10 OldFrog {Ondra Nemecek} | skóre: 36 | blog: Žabákův notes | Praha
Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč

Tak předně tabulka může referencovat sama sebe a problém s tím není. A dále mi (letmým pohledem) přijde, že ta data chcete modelovat:

buď jako strom (jeden záznam může mít více potomků)
nebo jako revize (kdy jeden záznam má více revizí, z nichž platí ta s nejvyšším číslem)
anebo jako nějaký obecný graf, pokud má být více záznamů nahrazeno jediným záznamem

Existují speciální grafové databáze, anebo k tomu můžete použít i sql. Záleží, jak hodně se nad těm daty bude operovat a kolik těch dat je. Hledejte něco jako "store graph data in sql database", "revisions model for data in sql database" nebo "graph database".

-- OldFrog

10.1.2020 11:07 Aleš Janda | skóre: 23 | blog: kýblův blog | Praha
Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč

Díky. Spíš se k tomu blíží nejvíc ten obecný graf, ale acyklický: novější záznamy ukazují na ty starší, ale starší nemůžou odkazovat na novější.

Hledal jsem různé metody (třeba to číslo revize je super jednoduché, ale to nemůžu použít), ale moc jsem řešení zatím bohužel nenašel :-(

Grafovou databázi použít asi můžu, ale PostgreSQL už mám na všechno ostatní, tak se mi nechce zavádět do projektu další závislosti (a další vrstvy komplexity).

Zahrajte si trojšachy přes internet :-)

9.1.2020 12:36 gnat
Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč

Pokud to má být optimalizováno na čtení, tak bych novou a tudíž poslední platnou informaci nastavil jako parenta těch zdrojových řádků. Znamená to při insertu i update zdrojových řádků, ale při selectu pak čtu jen to, co má parent_id null, což je levná podmínka.

10.1.2020 11:12 Aleš Janda | skóre: 23 | blog: kýblův blog | Praha
Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč

Jo, tohle je docela dobrý hack. To parent_id má tedy být spíše child_id, trochu potíž je v tom, že jeden záznam může vygenerovat více různých, takže ty vazby musí být v tabulce vedle (ale to asi musí být tak jako tak).

Není to optimální řešení z toho pohledu, že bych mohl napsat DELETE FROM … WHERE algoritmus = 'nefunguje' a ono to samo upravilo i ty sloupce child_id, ale tak lepší než nic :-)

Zahrajte si trojšachy přes internet :-)

10.1.2020 22:43 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč

Pokud algoritmů není mnoho, mohl bys u každého záznamu mít bitmapu značící algoritmy, které daný řádek ovlivnily. Při odvození nového řádku bys provedl OR bitmap všech použitých řádků a přidal bit aktuálního algoritmu.

Pokud chceš indexovat, můžeš použít místo bitmapy samostatné indexované sloupečky. V takovém případě asi bude rozumné použít samostatnou tabulku s 1:1 relací na datovou tabulku.

Hello world ! Segmentation fault (core dumped)

13.1.2020 12:07 logik
Rozbalit Rozbalit vše Re: PgSQL: Efektivní opakované hledání záznamů, na které nevede cizí klíč

Pokud je "dětí" víc, tak si ukládej k rodičům pouze počet dětí (updatuj to třeba triggerem) a hledej ty s nulou dětí.

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje