Portál AbcLinuxu, 27. května 2024 15:39

BASH - IFS je mocná zbraň

11.2.2005 12:15 | Přečteno: 10031× | BASH | poslední úprava: 11.2.2005 13:29

Tak jsem zase potřeboval něco naprogramovat. Člověk by si řekl, když nevím jak na to v bashi, použij něco silnějšího, třeba perl. Ale to bych nebyl já, kdybych to aspoň nezkusil. Takže máme nějaký textový soubor s daty z měření a v něm za komentářem jsou popisky jednotlivých sloupečků. Kdyby to byla jen jedna série s jedněmi popisky, tak je to naprosto jednoduché, ale těch sérií je víc a jak na potvoru každá má jiné popisky. No a já z toho chci vytvořit příkaz pro gnuplot s tím, že si uživatel může vybrat kterou sérii a který sloupeček chce zobrazit. To vyžaduje mít možnost načíst jednotlivé popisky do proměných a pak se přes indexy k nim dostat při zpracování parametrů na příkazovém řádku. Pro ilustraci máme soubor mereni.dat:

# blabla komentar
# title: x,y,z
# title: x,s1
# title: x,s2
# prvni serie
1, 2, 3
2, 3, 4


#druha serie
1, 3
1, 4


#treti serie
1, 2
1, 1

Načtení celého souboru po řádcích by bylo celkem jednoduché

j=0
while read i; do radky[j]="$i"; let j++; done <mereni.dat
ale krajně pomalé a zbytečné a další zpracvání v bashi ještě pomalejší a nepohodlnější. Při pokusu to načíst už odfiltrované narazíme pochopitelně na problém
j=0
sed '/^# *title:/!d;s/^# *title: *//' mereni.dat |\
while read i; do radky[j]="$i"; let j++; done
protože cyklus while proběhne jako subproces a změna env (proměná radky) zůstane v subprocesu a už ji nikdy neuvidíme. To je ale pěkně hloupé. Když jsem nad tím přemýšlel, tak už jsem to chtěl zabalit, ale pak přišlo na scénu IFS. (Teda abych pravdu řekl, tak je ještě možnost si to uschovat do tmp souboru, ale nebuďme malí a měkcí.)

IFS určuje oddělovač: The Internal Field Separator that is used for word splitting after expansion and to split lines into words with the read builtin command. The default value is ``<space><tab><newline>''. Ve spojení s bashovými poli která zpracovávají

a=("řetězec")
právě pomocí word spliting je myslím jasné, jak na to. Posledním zádrhelem je, jak nacpat do IFS právě jen a pouze konec řádku (mimochodem C-V C-M nebo Enter je \r tedy návrat vozíku a ne přechod na další řádek \n jak bych čekal), takže IFS="^M" vložené touto kombinací nefunguje, což mě málem přivedlo k myšlence, že je to rozbité. Není. Nejjednodušší je
IFS="
"
Což při přepisu může být trošku matoucí takže uvažuji o "čitelnější" variantě
IFS="$(echo -e \"\\n\")"
nebo
IFS="$(printf -e \"\\n\")"
Brr, ale při přepisu někým jiným by v tom mohlo být míň chyb. Takže výsledkem může být něco takového
# natáhneme popisy titulků
IFS="$(echo -e \"\\n\")" titles=($(sed '/^# *title:/!d;s/^# *title: *//' mereni.dat))
# na jdenom řádku je to proto, abych nemusel obnovovat IFS=''
# k jednotlivým titulkům se pak dá snadno dostat pomocí
IFS=',' title=(${titles[$serie]})
def=" t '${title[$column]}'"
kde proměné serie a column získám obligátní cyklem zpracovávajícím paramery příkazového řádku.

Dobrou noc milé děti.

       

Hodnocení: 100 %

        špatnédobré        

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

Komentáře

Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře. , Tisk

Diskuse byla administrátory uzamčena

11.2.2005 13:10 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše $'\n'
s/nebuďme malý/nebuďme malí/
s/bashovými poly/bashovými poli/
s/rozbyté/rozbité/
s/Nejjednodužší/Nejjednodušší/
A teď k věci. Zdaleka nejjednodušší způsob, jak dostat do IFS jen \n, je
IFS=$'\n'
:-)

Ale jinak pěkné, s tou rourou by mi asi docela trvalo, než by mi to došlo.
11.2.2005 13:40 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: $'\n'
Dík moc za bugreport. V téhle podobě je to pro mě ideální, protože to edituju ve gvimu přes mozex ;-) To by mě zajímalo jestli by to bylo tak jednoduché v "normálním" editoru viz.Proč nemám rád VIM. Asi těžko to bude jednodušší než stisknout dvě klávesy :% kliknout prostředním tlačítkem a entr :-D

To s tím $'\n' jsem zase neznal já. Když ten bash(1) je tak rozsáhlý a já myslel, že v sekci QUOTING se nedočtu nic zajímavého ;-)
XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
11.2.2005 14:11 Martin Čížek | skóre: 20 | Praha
Rozbalit Rozbalit vše Re: $'\n'
Sakra, asi bych měl otevřené záložky hned zpracovávat, abych nechodil s křížkem po funuse :-).
Kdyby dva z nás byli dvěma z nich, všichni z nás by mohli být všemi z nich.
11.2.2005 14:09 Martin Čížek | skóre: 20 | Praha
Rozbalit Rozbalit vše Jak pěkně nacpat do IFS (či jinam) divotvorné znaky
Tak třeba mezera, tabulátor, nový řádek:
IFS=$' \t\n'
Kdyby dva z nás byli dvěma z nich, všichni z nás by mohli být všemi z nich.
11.2.2005 14:37 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: Jak pěkně nacpat do IFS (či jinam) divotvorné znaky
Kdybych si přečetl QUOTING tak bych to třeba věděl taky :-) Je fakt, že takhle to vypadá jako bych se pokoušel o most obfuscated verzi jednoduchého IFS=$'\n'

P.S.: Furt se něco učím.
XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.
11.2.2005 15:41 Martin Čížek | skóre: 20 | Praha
Rozbalit Rozbalit vše Re: Jak pěkně nacpat do IFS (či jinam) divotvorné znaky
Já jsem si tam toho také dlouho nevšiml. Na dolar – uvozovka jsem poprvé narazil ve výstupu set, resp. set | grep IFS :-).
Kdyby dva z nás byli dvěma z nich, všichni z nás by mohli být všemi z nich.

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.