Portál AbcLinuxu, 20. května 2024 05:22


Nástroje: Začni sledovat (1) ?Zašle upozornění na váš email při vložení nového komentáře.

Vložit další komentář
27.2.2018 08:34 rastos | skóre: 62 | blog: rastos
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Odpovědět | Sbalit | Link | Blokovat | Admin
Tomu nerozumiem. To je nedostatok viet? Kľudne si môžu zobrať vety tohto príspevku. Všetky štyri.
27.2.2018 08:58 NN
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Musi to byt "free" vety pod creative common, takze nemuzes jen tak stahnout vsechnou co najdes.. a cesky ;).
Bystroushaak avatar 27.2.2018 11:50 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Já jsem tam zkoušel něco nahrávat z mých blogů, ale vybere si to z 50 vět asi tak 4. Vůbec netuším proč zrovna ty.
Bystroushaak avatar 27.2.2018 11:56 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Například vezmu celý blog Věnováno kouzelníkům a ten web si z toho cherrypickne věty:
  • Napadlo vás někdy, odkud se berou v Harry Potterovi kouzla?
  • Vážně, jak někdo vytvoří nové kouzlo?
  • Jak ho pak předá někomu dalšímu?
  • Je široce dostupný a cena se neustále propadá.
  • To vše díky magii technologie, kterou umíme využít.
  • Od mých patnácti let chci být kouzelníkem.
  • Naučil jsem se programovat.
  • Jedna, nula.
Což teda mi přijde docela málo.
27.2.2018 12:26 mica
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Sice jde o výslovnost, o nic jiného, nicméně zrovna věta "Od mých patnácti let chci být kouzelníkem" je nesprávná, správně by měla znít "Od svých patnácti let chci být kouzelníkem."
27.2.2018 16:45 Vladan
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
To jste maličko mimo.... mých/svých.... Např. V polici mám pět mých pohárů/Půjčil mi pět svých pohárů. To je moje pivo/Pij si svoje pivo. Myslím, že rozdíl v použití je markantní...
27.2.2018 16:53 Vladan
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Takže Vaše oprava by byla správná v případě, že byste napsal, že od svých patnácti let chtěl být kouzelníkem....
27.2.2018 19:05 Kos
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Zvratná zájmena se používají i v 1. osobě.

"Mám svých starostí dost. Nepiju kyseliny, mám své zásady! Od svých lidí očekávám poslušnost. Od svých 15 let..."

Existují samozřejmě výjimky, třeba když chceme vlastnictví zdůraznit. Viz http://prirucka.ujc.cas.cz/?id=630

27.2.2018 22:09 OldFrog {Ondra Nemecek} | skóre: 36 | blog: Žabákův notes | Praha
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Obávám se, že dnes většina lidí zvratná zájmena už neumí použít a masivně se v tom dělají chyby i v tisku.
-- OldFrog
19.3.2018 10:29 Michal Vašíček
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Každá ta věta se filtruje. Nejdřív se rozdělí celý text na jednotlivé věty a potom se dropnou věty, které jsou delší než 60 znaků a které matchnou regex /["()„”“‚‘…\d]/. To proto, že nechceme citace, závorky apod. Když se koukám na ten článek, většina z toho asi spadne na délce věty, protože spousta vět z toho blogu má víc než 100 znaků. Kdyby se někomu chtělo, může věty manuálně rozdělit a poslat samostatně, ale... :D
28.2.2018 07:59 rastos | skóre: 62 | blog: rastos
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
No to mi je jasné, že musia byť "licenčne voľné". A to je problém? To keď sa napr. dvaja českí linuxáci bavia pri pive, tak majú problém vety, ktoré vyslovia, licencovať pod CC? Bárs ktorý tunajší blog má 100 viet. A to nerátam komentáre. To ich autori nie sú ochotní poskytnúť licenciu?

Keby tých viet potrebovali 2 milióny, tak by som chápal problém. Ale pre 2k mi to uniká.
28.2.2018 08:06 rastos | skóre: 62 | blog: rastos
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Tak ma napadá:
Ochrana podle práva autorského se nevztahuje na

a) úřední dílo, jímž je právní předpis, rozhodnutí, opatření obecné povahy, veřejná listina, ...
1.3.2018 13:09 Ravise
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Trénovat cokoliv na právním předpisu nebo rozhodnutí bych fakt nechtěl. Nebo nám ta umělá inteligence zblbne :)
Bystroushaak avatar 27.2.2018 12:12 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Odpovědět | Sbalit | Link | Blokovat | Admin
Jsem docela zvědavý, kdy se čeština objeví v mobilní aplikaci. Už před nějakou dobou jsem do ní četl asi 100 vět v angličtině.
blog.rfox.eu
28.2.2018 09:34 Noone
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
"Už před nějakou dobou jsem do ní četl asi 100 vět v angličtině."

A to má být co ? Novo-tech-čeština ?
Bystroushaak avatar 28.2.2018 10:35 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Co je "novo-tech-čeština"?
28.2.2018 14:14 ehm
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Asi nechápal:
Jsem docela zvědavý, kdy se čeština objeví v mobilní aplikaci. Už před nějakou dobou jsem do ní četl asi 100 vět v angličtině.
(Taky se nechytám BTW. Ani nevím, o jaké aplikaci je řeč.)
28.2.2018 14:29 Kate | skóre: 9
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
App přes kterou se dají nahrávat hlasové vzorky. Dá se říct další fáze po sběru vět, pokud to chápu dobře :)
Bystroushaak avatar 28.2.2018 15:39 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Ano, je to mobilní aplikace, přes kterou lze buďto hodnotit ostatní lidi, jestli fakt přečetli zadaný text dobře, nebo namlouvat konkrétní věty.

Celé je to otevřený projekt mající za cíl sehnat dataset pro rozpoznávání řeči, tak jsem zvědavý, kdy se tam objeví i čeština, když už sbírají psaný text v češtině. Když jsem naposledy koukal v pondělí, tak tam ještě vůbec nebyla možnost vybrat si jazyk (je tam kolonka, ale nedá se v ní nic vybrat).
19.3.2018 10:24 Michal Vašíček
Rozbalit Rozbalit vše Re: Mozilla.cz sbírá české věty pro Common Voice
Byť celkem pozdě, tak odpovím.

Co se mobilní aplikace týče, tak to je prakticky jen zabalený web voice.mozilla.org s přidanými workaroundy pro některá javascriptová API, která Safari na iOSu nepodporuje. Pracuje se na vyřešení těchto problémů i na webu a aplikace pak umře úplně.

Co se češtiny v aplikaci/na oficiálním webu týče, tak web ještě víc jazyků nepodporuje. Jen se tak tváří. :) V současné době jsou hotové překlady a možnost žádat o jazyk, brzo by měla být i podpora nahrávat víc jazyků. Potom se začne sbírat čeština na voice.mozilla.org. Už teď jsme ale na voice.mozilla.cz nasadili klon onoho oficiálního webu, kde sbíráme nahrávky. Všechna nasbíraná data potom předáme při spuštění češtiny na ofiko webu Mozille.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.