Přihlášení | Registrace

napište » Zprávičky

včera 14:55 | IT novinky

Před 70 lety, 7. června 1954, ve věku 41 let, zemřel Alan Turing, britský matematik, logik, kryptoanalytik a zakladatel moderní informatiky.

Ladislav Hagara | Komentářů: 10

NiceGUI, webový prohlížeč jako frontend pro kód v Pythonu

včera 11:44 | Zajímavý software

NiceGUI umožňuje používat webový prohlížeč jako frontend pro kód v Pythonu. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

Ladislav Hagara | Komentářů: 1

Home Assistant 2024.6

včera 10:55 | Nová verze

Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána ve verzi 2024.6. Z novinek lze vypíchnout lepší integraci LLM (OpenAI, Google AI, Ollama) nebo podporu Matter 1.3.

Ladislav Hagara | Komentářů: 0

IKEA otevře pobočku v Robloxu

6.6. 20:55 | IT novinky

IKEA ve Spojeném království hledá zaměstnance do své nové pobočky. Do pobočky v počítačové hře Roblox. Nástupní mzda je 13,15 liber na hodinu.

Ladislav Hagara | Komentářů: 0

Vulkan 1.3 na M1 za 1 měsíc, nový ovladač Honeykrisp

6.6. 10:44 | Zajímavý článek

Alyssa Rosenzweig se v příspěvku na svém blogu Vulkan 1.3 na M1 za 1 měsíc rozepsala o novém Vulkan 1.3 ovladači Honeykrisp pro Apple M1 splňujícím specifikaci Khronosu. Vychází z ovladače NVK pro GPU od Nvidie. V plánu je dále rozchodit DXVK a vkd3d-proton a tím pádem Direct3D, aby na Apple M1 s Asahi Linuxem běžely hry pro Microsoft Windows.

Ladislav Hagara | Komentářů: 38

Visual Studio Code a VSCodium 1.90

6.6. 01:00 | Nová verze

Byla vydána (𝕏) květnová aktualizace aneb nová verze 1.90 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a animovanými gify v poznámkách k vydání. Ve verzi 1.90 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

Ladislav Hagara | Komentářů: 0

Kali Linux 2024.2

6.6. 00:44 | Nová verze

Byla vydána (Mastodon, 𝕏) nová verze 2024.2 linuxové distribuce navržené pro digitální forenzní analýzu a penetrační testování Kali Linux (Wikipedie). Přehled novinek se seznamem nových nástrojů v oficiálním oznámení.

Ladislav Hagara | Komentářů: 0

Tetris slaví 40 let

5.6. 16:44 | IT novinky

Počítačová hra Tetris slaví 40 let. Alexej Pažitnov dokončil první hratelnou verzi 6. června 1984. Mezitím vznikla celá řada variant. Například Peklo nebo Nebe. Loni měl premiéru film Tetris.

Ladislav Hagara | Komentářů: 10

MicroPython 1.23.0

5.6. 10:44 | Nová verze

MicroPython (Wikipedie), tj. implementace Pythonu 3 optimalizovaná pro jednočipové počítače, byl vydán ve verzi 1.23.0. V přehledu novinek je vypíchnuta podpora dynamických USB zařízení nebo nové moduly openamp, tls a vfs.

Ladislav Hagara | Komentářů: 0

Ubuntu Core 24

5.6. 10:22 | Nová verze

Canonical vydal Ubuntu Core 24. Představení na YouTube. Nová verze Ubuntu Core vychází z Ubuntu 24.04 LTS a podporována bude 12 let. Ubuntu Core je určeno pro IoT (internet věcí) a vestavěné systémy.

Ladislav Hagara | Komentářů: 2

Centrum | Napsat | Starší

Rozcestník

AbcLinuxu

HDmag.cz

AbcLinuxu:/ Poradna / Linuxová poradna / Zarovnání českého textu do bloku v terminálu, včetně dělení slov

Štítky: filtr, groff

Dotaz: Zarovnání českého textu do bloku v terminálu, včetně dělení slov

26.2.2019 19:15 vencas | skóre: 32
Zarovnání českého textu do bloku v terminálu, včetně dělení slov

Přečteno: 383×

Odpovědět | Admin

Zdravím, potřebuji zarovnat text (monospace písmo) na předem stanovenou šířku, aby byl přitom do bloku (tj do kraje na obou stranách) a fungovalo dělení slov. Funkční ideálně jako filtr v command-lině. Existuje něco takového? Našel jsem paradj.pl, ale ten neumí češtinu, stejně jako např. groff ap. Díky za nápomoc.

Řešení dotazu:

Komentář #11 (vencas, 1 hlasů)

Nástroje: Začni sledovat (1) ?

Odpovědi

26.2.2019 19:18 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Zarovnání českého textu do bloku v terminálu, včetně dělení slov

Můžeš zkusit ukecat pandoc jestli by to nějak nenaformátoval.

Hello world ! Segmentation fault (core dumped)

26.2.2019 20:38 vencas | skóre: 32
Rozbalit Rozbalit vše Re: Zarovnání českého textu do bloku v terminálu, včetně dělení slov

Co vím (a pro jistotu jsem ještě ověřoval), pandoc převádí mezi sebou formáty textu, má nějakou vnitřní reprezentaci, ale reprezentací textu se nezabývá.

26.2.2019 23:44 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Zarovnání českého textu do bloku v terminálu, včetně dělení slov

Pandoc konvertuje z jednoho formátu do druhého a mezi možné výstupní formáty patří i plain text nebo Markdown. Nezkoumal jsem, jak moc to splňuje zadání, ale mohlo by to produkovat použitelný výstup.

Hello world ! Segmentation fault (core dumped)

26.2.2019 20:03 debian+
Rozbalit Rozbalit vše Re: Zarovnání českého textu do bloku v terminálu, včetně dělení slov

Webovy prehladavac.

26.2.2019 20:39 vencas | skóre: 32
Rozbalit Rozbalit vše Re: Zarovnání českého textu do bloku v terminálu, včetně dělení slov

Tak jsem to zkoušel a text mi do bloku nezarovná. Jestli jste na něco narazil, rád se poučím. Já jsem opravdu nenašel nic. Pro jistotu zdůrazňuju: potřebuju správné dělení slov pro češtinu.

26.2.2019 21:30 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: Zarovnání českého textu do bloku v terminálu, včetně dělení slov

A už to "správné dělení slov pro češtinu" niekto naklepal do slovníkov? Bez toho to pôjde veľmi ťažko, a s tým to pôjde aj v to groff.

26.2.2019 22:10 wamba | skóre: 38 | blog: wamba
Rozbalit Rozbalit vše Re: Zarovnání českého textu do bloku v terminálu, včetně dělení slov

Příloha:

paradj.pl (5001 bytů)

Ten paradj.pl používá Tex::Hyphen, který podporuje i češtinu. Neříkám že ideální, ale nějaký slovník to je. Tedy bych zkusil si ten skript upravit:

<  
---
> binmode(STDIN,  ":utf8");
> binmode(STDOUT, ":utf8");
> 
> 
18,19c21
< my $hyp = new TeX::Hyphen;
<  
---
> my $hyp = new TeX::Hyphen '/usr/share/texmf-dist/tex/csplain/base/czhyphen.tex', 'style' => 'czech',;

This would have been so hard to fix when you don't know that there is in fact an easy fix.

26.2.2019 21:57 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: Zarovnání českého textu do bloku v terminálu, včetně dělení slov

Groff umí dělit slova, dokonce má i slovník s českým dělení slov (ukradený z TeXu). Jen se mu musí říci, že jazyk je čeština parametrem -mcs. Příklad manuálové stránky natažené na šířku terminálu včetně dělených slov:

(echo ".ll ${COLUMNS}\n"; bzcat /usr/share/man/cs/man1/shigofumi.1.bz2) | /usr/bin/preconv | groff -Tutf8 -mandoc -mcs

26.2.2019 22:08 mhepp
Rozbalit Rozbalit vše Re: Zarovnání českého textu do bloku v terminálu, včetně dělení slov

Trochu nerozumím tomu, jak chceš dodržet podmínku, že na každém řádku bude přesně daný počet znaků. Aby to vyšlo vždy na konec slova nebo alespoň mezi dělitelné slabiky. Jak bys chtěl vyřešit nálsedující problém?

...
řádek textu zadané šířky
další řádek blbě vycházející

Totiž můžeš zarovnat:

...
řádek textu zadané šířky
další řádek blbě vychá-
zející

nebo:

...
řádek textu zadané šířky
další řádek blbě vycháze-
jící

což není ani v jednom případě do bloku.

26.2.2019 23:42 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Zarovnání českého textu do bloku v terminálu, včetně dělení slov

Prostě tam nastrkáš mezery a vybereš to nejhezčí. Viz zdrojáky TeXu.

Hello world ! Segmentation fault (core dumped)

Řešení 1× (vencas (tazatel))

27.2.2019 22:39 vencas | skóre: 32
Rozbalit Rozbalit vše Re: Zarovnání českého textu do bloku v terminálu, včetně dělení slov

Konečné řešení vezme sazbu TeXu s monospace fontem, převede ji z pdf to txt a přidává mezery na vhodná místa, dokud nemá řádek požadovanou šířku. Zde je výstup pro český výplňový text z http://wellstyled.com/tools/dummy-cz/:

Těby dived ptyzruně. Měji šlucry
tří  chré lážlotist vumrou tiper
v nic gláti úmýpech. Vlydi trou-
di prýv k paská sro  prytě  fly-
křu v kust.  Oří o půcpa a vimoj
opo  trouchetrá  utě děšležrokla
a mlehřou.  Puďni šru  vonitědre
crodra vremhrn niv,  nit těpoma-
bud zroum nědě hlysk srážlo věti
v chévu břat z mřidis.  Vrůštniž
hrec z divluděře důd hrovu  mru-
fí hlů člymflů miť.  Dě timan vé
vřep  dředi  hlíboumrů  otoučpa-
bi vadigu  skecru krel  opiv ha-
ti. Flůchlavrum o mrepré z glouš
stomřá,  cláni  ratikřes sámřáč-
lit  šle a matěňáďsé.  Z  dělkác
vostáčloř děť  nip chlapréleň  s
myktý.  Fi  mlíďglůch  v clů ně-
chreť  nichra kra zytý pepo zlo-
famne  leř.  Třužláč klyť i vydě
vo těž ďodlo hružlech drbětrévře
tlezaz myv.  Mežrůst šlévro nyd.

A kdyby to někdo potřeboval, tady je kód:

#!/usr/bin/env python3
def monoblock(text,width=80,lang='czech',emergencystretch='2em'):
    content=r'''
    \documentclass[]{article}
    \usepackage{polyglossia}
    \setdefaultlanguage{%s}
    %%\usepackage{showhyphens}
    \usepackage{fontspec}
    \setmainfont{Latin Modern Mono}
    \pagestyle{empty}
    \usepackage{ragged2e}
    \lefthyphenmin=2
    %% tune emergencystretch by hand until happy
    \emergencystretch=%s
    \parindent=0pt
    \begin{document}
        \begin{minipage}{%dex}
            \RaggedRight
            %s
        \end{minipage}
    \end{document}
    '''%(lang,emergencystretch,width,text)
    import tempfile, subprocess, os.path, webbrowser, time
    with tempfile.TemporaryDirectory() as tmpDir:
        tex,pdf=[tmpDir+'/main.'+ext for ext in ('tex','pdf')]
        print(tex)
        f=open(tex,'w')
        f.write(content)
        f.close()
        subprocess.call(['lualatex',tex],cwd=tmpDir)
        txt=subprocess.check_output(['pdftotext','-raw',pdf,'-']).decode('utf-8')
        webbrowser.open('file://'+os.path.abspath(pdf))
        time.sleep(2)
        return expandToBlock(txt,width)

def expandToBlock(txt,wd):
    import re, random
    ll=txt.split('\n')
    lens=[len(l) for l in ll]
    maxWd=max(lens)
    if maxWd>wd: print('WARN: max unexpanded text width %d is greater than required width %d. Increasing to %d.'%(maxWd,wd,maxWd))
    wd=maxWd
    for i,l in enumerate(ll):
        # skip last paragraph line
        if i+1==len(ll) or (i+1<len(ll) and ll[i+1]==''): continue
        pats=[r'… \b',r'\. \b',r': \b',r', \b',r'\) \b',r'\b \(',r'\b \b']
        patReps=['… ','. ',': ',', ',') ',' (',' ']
        for ex in range(1,5): # expand to multiple spaces
            for pat,prep in zip([p.replace(' ',ex*' ') for p in pats],patReps):
                matches=list(re.finditer(pat,l))
                if not matches: continue
                #random.shuffle(matches)
                todo=min(len(matches),wd-len(l))
                m2=random.sample(matches,todo)
                # print('use %d occurrences of "%s" (out of %d)'%(todo,pat,len(matches)))
                # replace from right to left to preserve indices
                for m in sorted(m2,key=lambda x: -x.span()[0]): l=l[:m.span()[0]]+prep.replace(' ',(ex+1)*' ')+l[m.span()[1]:]
                if len(l)==wd: break
            if len(l)==wd: break
        ll[i]=l
    return '\n'.join(ll)



if __name__=='__main__':
    print('\n\n'+monoblock('Těby dived ptyzruně. Měji šlucry tří chré lážlotist vumrou tiper v nic gláti úmýpech. Vlydi troudi prýv k paská sro prytě flykřu v kust. Oří o půcpa a vimoj opo trouchetrá utě děšležrokla a mlehřou. Puďni šru vonitědre crodra vremhrn niv, nit těpomabud zroum nědě hlysk srážlo věti v chévu břat z mřidis. Vrůštniž hrec z divluděře důd hrovu mrufí hlů člymflů miť. Dě timan vé vřep dředi hlíboumrů otoučpabi vadigu skecru krel opiv hati. Flůchlavrum o mrepré z glouš stomřá, cláni ratikřes sámřáčlit šle a matěňáďsé. Z dělkác vostáčloř děť nip chlapréleň s myktý. Fi mlíďglůch v clů něchreť nichra kra zytý pepo zlofamne leř. Třužláč klyť i vydě vo těž ďodlo hružlech drbětrévře tlezaz myv. Mežrůst šlévro nyd.',width=40,emergencystretch='2em'))

Založit nové vlákno • Nahoru

Tiskni Sdílej:

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje