Přihlášení | Registrace

napište » Zprávičky

GitLab 17

17.5. 13:44 | Nová verze

Byla vydána (𝕏) nová major verze 17 softwarového nástroje s webovým rozhraním umožňujícího spolupráci na zdrojových kódech GitLab (Wikipedie). Představení nových vlastností i s náhledy a videi v oficiálním oznámení.

Ladislav Hagara | Komentářů: 0

Sovereign Tech Fund podpoří vývoj FFmpeg

17.5. 12:22 | Komunita

Sovereign Tech Fund, tj. program financování otevřeného softwaru německým ministerstvem hospodářství a ochrany klimatu, podpoří vývoj FFmpeg částkou 157 580 eur. V listopadu loňského roku podpořil GNOME částkou 1 milion eur.

Ladislav Hagara | Komentářů: 0

24. září 2024 budou zveřejněny zdrojové kódy přehrávače Winamp

17.5. 01:55 | Komunita

24. září 2024 budou zveřejněny zdrojové kódy přehrávače Winamp.

Ladislav Hagara | Komentářů: 10

Google Chrome 125

16.5. 23:33 | Nová verze

Google Chrome 125 byl prohlášen za stabilní. Nejnovější stabilní verze 125.0.6422.60 přináší řadu oprav a vylepšení (YouTube). Podrobný přehled v poznámkách k vydání. Opraveno bylo 9 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře.

Ladislav Hagara | Komentářů: 1

Neovim 0.10

16.5. 21:11 | Nová verze

Textový editor Neovim byl vydán ve verzi 0.10 (𝕏). Přehled novinek v příspěvku na blogu a v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0

Tails 6.3

16.5. 20:55 | Nová verze

Byla vydána nová verze 6.3 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Přehled změn v příslušném seznamu. Tor Browser byl povýšen na verzi 13.0.15.

Ladislav Hagara | Komentářů: 0

Byla spuštěna první aukce domén .CZ

16.5. 13:33 | IT novinky

Dnes ve 12:00 byla spuštěna první aukce domén .CZ. Zatím největší zájem je o dro.cz, kachnicka.cz, octavie.cz, uvycepu.cz a vnady.cz [𝕏].

Ladislav Hagara | Komentářů: 9

JackTrip 2.3.0

16.5. 13:22 | Nová verze

JackTrip byl vydán ve verzi 2.3.0. Jedná se o multiplatformní open source software umožňující hudebníkům z různých částí světa společné hraní. JackTrip lze instalovat také z Flathubu.

Ladislav Hagara | Komentářů: 0

jOpenSpace 2024, registrace otevřeny

16.5. 12:22 | Pozvánky

Patnáctý ročník ne-konference jOpenSpace se koná 4. – 6. října 2024 v Hotelu Antoň v Telči. Pro účast je potřeba vyplnit registrační formulář. Ne-konference neznamená, že se organizátorům nechce připravovat program, ale naopak dává prostor všem pozvaným, aby si program sami složili z toho nejzajímavějšího, čím se v poslední době zabývají nebo co je oslovilo. Obsah, který vytváří všichni účastníci, se skládá z desetiminutových

… více »

Zdenek H. | Komentářů: 0

MakeHuman 1.3.0

16.5. 03:11 | Nová verze

Program pro generování 3D lidských postav MakeHuman (Wikipedie, GitHub) byl vydán ve verzi 1.3.0. Hlavní novinkou je výběr tvaru těla (body shapes).

Ladislav Hagara | Komentářů: 9

Centrum | Napsat | Starší

navrhněte » Anketa

Podle hypotézy Mrtvý Internet mj. tvoří většinu online interakcí boti.

Jsem bot. (75%)

Jsem člověk. (5%)

Opravdu jsem člověk! (10%)

Jsem něco jiného. (9%)

Celkem 316 hlasů

Komentářů: 16, poslední 14.5. 11:05

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Programovací poradna / Proudové zpracování dat – nejlepší praktiky

Štítky: ATD, data, kolekce, software, textové editory, Vim

Dotaz: Proudové zpracování dat – nejlepší praktiky

5.7.2013 12:06 xkucf03 | skóre: 49 | blog: xkucf03
Proudové zpracování dat – nejlepší praktiky

Přečteno: 724×

Odpovědět | Admin

Dnešní software se většinou skládá z mnoha komponent a vrstev a ty si mezi sebou předávají objekty. Např. načtu data z databáze nebo souboru (sítě atd.) a předám kolekci záznamů někam dál, tam se data nějak transformují, zpracují, předají další komponentě (opět jako kolekce nebo objekt) a po několika takových fázích vyplivnou na výstup.

Výhoda je v abstrakci a v tom, že komponenty jsou celkem samostatné, dají se samostatně vyvíjet, testovat, znovupoužívat, není to jeden monolitický bastl. Na druhou stranu nevýhoda je v tom, že první záznam na výstupu vypadne nejdříve ve chvíli, kdy se načte poslední záznam na vstupu. A taky v tom, že v jednu chvíli musím mít celou množinu načtenou v paměti.

Rád bych v programu měl něco jako unixové roury a zpracovával data průběžně – tzn. vstup může být teoreticky nekonečný, spotřeba paměti je konstantní (jeden řádek/záznam nebo stanovená velikost bufferu) doba zpracování lineárně závislá na velikosti vstupu.

Řešením může být předávání iterátorů (některé jazyky mají generátory/yield), kurzorů v SQL, vstupně/výstupních proudů… Vím, jak dosáhnout požadovaného výsledku. Ale jak ho dosáhnout co nejelegantněji a nejčistší cestou? Jaké jsou nejlepší praktiky, aby to bylo efektivní a zároveň to nebyl zprasený neudržovatelný monolit? Víte o nějakém jazyku/frameworku, který by umožňoval poskládat (pokud možno deklarativně) jednotlivé komponenty systému a nechat jimi proudit data? Nemáte příklad softwaru, který se s tímhle problémem vyrovnává nějak elegantně a poučně?

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

Nástroje: Začni sledovat (2) ?

Odpovědi

5.7.2013 12:16 Kit
Rozbalit Rozbalit vše Re: Proudové zpracování dat – nejlepší praktiky

Možná do bude znít divně, ale co třeba Bash?

5.7.2013 12:56 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Proudové zpracování dat – nejlepší praktiky

Jde mi spíš o řešení v rámci jednoho programu a programovacího jazyka. Pouštět pro každou komponentu zvláštní proces není ideální (i když to nevylučuji) a hlavně jsem tu omezený na proudy bajtů – což se někdy taky hodí, ale když budu zpracovávat nějaké záznamy/objekty, musím je na výstupu z jedné komponenty serializovat a na vstupu druhé zase deserializovat.

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

5.7.2013 13:06 Kit
Rozbalit Rozbalit vše Re: Proudové zpracování dat – nejlepší praktiky

V tom případě bych asi zvolil Javu, ta je na to vybavena.

5.7.2013 13:00 Mr.S1lent.cz
Rozbalit Rozbalit vše Re: Proudové zpracování dat – nejlepší praktiky

Muzes posilat z client side subrequesty a zpracovavat je nezavisle na aplikaci. Avsak hlavni nevyhoda tohoto modelu je ta, ze kdyz dojde k nejake chybe v nejakem subrequestu, aplikace to nezjisti. Proto se kolikrat stava u vyvojaru webovych aplikaci, kteri nepouzivaji nejaky output buffering, ze jim to zvesela vypisuje chybove hlasky do nactene aplikace, protoze takto neudelaji zadne presmerovani na code 500/404/aj., pokud si to neporesi na strane klienta, coz je ovsem spatne...

Kazdopadne dnesni hw poskytuje dostatecny vypocetni vykon za malo penez, resp. za mnohem mene penez pri srovnani platu a casu programatora, takze se nadtimto nevyplati moc premyslet. Navic tento model zase vytezuje procesor vytvarenim dalsich vlakej pro subprocesy, takze je otazka, co je vetsi overhead :)

5.7.2013 13:54 Radek Miček | skóre: 23 | blog: radekm_blog
Rozbalit Rozbalit vše Re: Proudové zpracování dat – nejlepší praktiky

Řešením může být předávání iterátorů (některé jazyky mají generátory/yield), kurzorů v SQL, vstupně/výstupních proudů… Vím, jak dosáhnout požadovaného výsledku. Ale jak ho dosáhnout co nejelegantněji a nejčistší cestou?

Nevím, zda to je elegantní, ale Haskell má koinduktivní typy a jinou redukční strategii, takže se tam mnoho věcí chová "líně", aniž by programátor musel něco speciálního dělat. Nevýhodou je, že programátor ztrácí přehled, kdy se jaká věc vlastně počítá.

Jaké jsou nejlepší praktiky, aby to bylo efektivní a zároveň to nebyl zprasený neudržovatelný monolit?

Oboje zvládá Haskell docela dobře. Kompilátor GHC provádí fúzi, čímž dosahuje docela dobré efektivity (a stávající fúze se možná dočká dalšího vylepšení).

5.7.2013 14:02 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Proudové zpracování dat – nejlepší praktiky

Vytvářet a předávat různé iterátory/handles můžeš předávat v libovolném programovacím jazyce. Nevím, co na tom chceš vymýšlet elegantního, prostě potřebuješ být schopný udržovat nějaký iterátorový objekt a zpřístupnit ho pomocí nějakého API, toť vše.

Já už tu vlastně ani nejsem. Abclinuxu umřelo.

5.7.2013 20:28 potato
Rozbalit Rozbalit vše Re: Proudové zpracování dat – nejlepší praktiky

To samozřejmě můžeš, ovšem otázka zněla, jak to dělat efektivně. Když budeš posílat každý jednotlivý párbajtový kousek dat (což naivní použití iterátorů/handles klidně způsobí), nebudou všechna jádra procesoru dělat nic jiného, než zběsile managovat fronty. Na druhé straně bufferbloat vede k tomu, že na sebe věci čekají a stejně to sežere dost paměti.

6.7.2013 09:20 pavlix | skóre: 54 | blog: pavlix
Rozbalit Rozbalit vše Re: Proudové zpracování dat – nejlepší praktiky

K tomu ale potřebuješ předvídat, jak bude komunikace vypadat a podle toho to naprogramovat.

Já už tu vlastně ani nejsem. Abclinuxu umřelo.

5.7.2013 17:50 rnd
Rozbalit Rozbalit vše Re: Proudové zpracování dat – nejlepší praktiky

http://www.playframework.com/documentation/2.0.2/Iteratees

http://mandubian.com/2012/08/27/understanding-play2-iteratees-for-normal-humans/

5.7.2013 18:10 Radek Miček | skóre: 23 | blog: radekm_blog
Rozbalit Rozbalit vše Re: Proudové zpracování dat – nejlepší praktiky

Slajdy s přehledem podobných technik.

6.7.2013 13:59 Ivan
Rozbalit Rozbalit vše Re: Proudové zpracování dat – nejlepší praktiky

A co tohle? Map&Reduce

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje