Zdravím,
řeším tady v linuxu věc, jak si ušetřit čas a převést mluvené slovo na text, aniž bych to musel odposlouchat a přepsat. Nemáte s tím někdo zkušenost, jestli to jde a případně jak? Potřebuji vytvořit titulky k jedné přednášce a jde mi o ušetření času.
Díky.
Zkus prozkoumat aplikace o kterých se píše na stránce Speech recognition. Ale jsem skeptický. Jediné řešení, které by se dalo označit za funkční je od Google. Jenže to funguje pouze online a nepochybně těží z mnoha získaných vzorků. Ale možná se mýlím.
Rád bych tě nasměroval konkrétněji, ale už je to nějaký čas, co jsem si s tím hrál. Pokud jde o Google, tak převod hlasu na text jeho prostřednictvím umí každý blbý mobil s Androidem. Jenom bys musel pohledat nějaké api, přes které bys to rozsekal na nějaké menší kousky. Koukni sem.
No to že blbý mobil z androidem něco umí neznamená, že funkcionalita se dá dosáhnout i třeba na webu a v počitači. Třeba příklad, v číně a v japonsku jsem v mobilu používal google translate (dokonce s offline slovnikem) který po namíření objektivu mobilu provedl textový překlad (funkionalita jakž takž použitelné). Kdyý jsem později hledal, jestli podobný nástroj by mohl fungovat i na japonské anime, když bych tedy z obrázku označil pole s japonským tesxtem a dostal překlad tak jsem obdobnou možnost nenašel a snímat obrazovku mobilem je trochu příliž hardcore (na pár textu jsem to zkusil a fungovalo to, ale dlouhodoběji to nejde). S převodem řeči do textu to může být podobně.