abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 17:55 | Nová verze

    Ubuntu pro testování nových verzí vydává měsíční snapshoty. Dnes vyšel 1. snapshot Ubuntu 26.04 LTS (Resolute Raccoon).

    Ladislav Hagara | Komentářů: 0
    včera 14:33 | IT novinky

    Zástupci členských států EU se včera shodli na návrhu, který má bojovat proti šíření materiálů na internetu zobrazujících sexuální zneužívání dětí. Nařízení známé pod zkratkou CSAM a přezdívané chat control mělo množství kritiků a dlouho nebyla pro jeho schválení dostatečná podpora. Pro schválení byla potřeba kvalifikovaná většina a dánské předsednictví v Radě EU se snažilo dosáhnout kompromisu. Návrh nakonec po dlouhých týdnech

    … více »
    Ladislav Hagara | Komentářů: 6
    včera 12:22 | Zajímavý software

    Britské herní studio Facepunch stojící za počítačovými hrami Garry's Mod a Rust uvolnilo svůj herní engine s&box (Wikipedie) jako open source. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT. Herní engine s&box je postavený nad proprietárním herním enginem Source 2 od společnosti Valve.

    Ladislav Hagara | Komentářů: 1
    včera 04:55 | Komunita

    Vývoj programovacího jazyka Zig byl přesunut z GitHubu na Codeberg. Sponzoring na Every.

    Ladislav Hagara | Komentářů: 1
    včera 04:44 | Komunita

    Stejně jako GNOME i KDE Plasma končí s X11. KDE Plasma 6.8 poběží už pouze nad Waylandem. Aplikace pro X11 budou využívat XWayland.

    Ladislav Hagara | Komentářů: 1
    26.11. 14:55 | IT novinky

    Poslanci Evropského parlamentu dnes vyzvali k výraznému zvýšení ochrany nezletilých na internetu, včetně zákazu vstupu na sociální sítě pro osoby mladší 16 let. Legislativně nezávazná zpráva, kterou dnes odsouhlasil Evropský parlament poměrem 493 hlasů pro ku 92 proti, kromě zavedení věkové hranice 16 let pro využívání sociálních sítí, platforem pro sdílení videí či společníků s umělou inteligencí (AI) vyzývá také k zákazu … více »

    Ladislav Hagara | Komentářů: 44
    26.11. 14:11 | Humor

    Doom v KiCadu nebo na osciloskopu? Žádný problém: KiDoom: Running DOOM on PCB Traces a ScopeDoom: DOOM on an Oscilloscope via Sound Card.

    Ladislav Hagara | Komentářů: 3
    26.11. 12:44 | Nová verze

    Po AlmaLinuxu byl v nové stabilní verzi 10.1 vydán také Rocky Linux. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    26.11. 04:00 | Zajímavý software

    Open source reimplementace počítačových her Tomb Raider I a Tomb Raider II spolu s dalšími vylepšeními a opravami chyb TRX byla vydána ve verzi 1.0. Jedná se o sloučení projektů / enginů TR1X a TR2X do jednoho TRX. Videoukázka na YouTube.

    Ladislav Hagara | Komentářů: 1
    25.11. 17:00 | IT novinky

    Společnost Seznam.cz spouští konverzační nástroj založený na umělé inteligenci Seznam Asistent. Asistent využívá vlastní jazykový model SeLLMa a dočasně i komerční modely od OpenAI provozované v evropských datacentrech prostřednictvím Microsoft Azure. Dlouhodobým cílem Seznamu je provozovat Asistenta výhradně na interních jazykových modelech a ve vlastních datových centrech.

    Ladislav Hagara | Komentářů: 8
    Jaké řešení používáte k vývoji / práci?
     (34%)
     (47%)
     (19%)
     (18%)
     (22%)
     (15%)
     (23%)
     (16%)
     (18%)
    Celkem 410 hlasů
     Komentářů: 17, poslední 19.11. 21:57
    Rozcestník

    MySQL - blbne kódování

    Znakové sady pro komunikaci klienta se serverem a znakové sady pro uložení dat

    Při problému se znakovou sadou je podstatné rozlišovat znakové sady pro:
    • komunikaci klienta se serverem
    • samotné uložení dat
    ad a) Použité znakové sady při komunikaci server/klient ovlivňují 3 proměnné:
    • character_set_client - znaková sada, ve které jsou data poslána klientem
    • character_set_connection - znaková sada, do které jsou poslaná data od klienta překonvertována
    • character_set_results - znaková sada, ve které jsou výsledná data zaslána klientovi
    vypsat proměnné související se znakovými sadami lze takto: show variables like '%character%';

    Pro nastavení výše uvedených proměnných existují "zkratky":
    • set names x; je ekvivalentní (nezmiňuji nastavení collation):
      
      set character_set_client = x;
      set character_set_results = x;
      set character_set_connection = x;
      
      
    • set character set x; je ekvivalentní (nezmiňuji nastavení collation):
      
      set character_set_client = x;
      set character_set_results = x;
      set character_set_connection = @@character_set_database
      
      
    • parametr --default-character-set=x u mysql klienta a mysqldump odpovídá vykonání: set names x;
    ad b) Znaková sada pro uložení dat se dá nastavit pro:
    • server - nastavení typicky v sekci [mysqld] v my.cnf
    • databázi - nastavení typicky při tvorbě databáze: create database x character set y;
    • tabulku - nastavení typicky při tvorbě tabulky: create table x ... character set y;
    • sloupec - nastavení typicky při tvorbě tabulky: ... columnx varchar(255) character set y ...
    • řetězec - např. _latin1'abc' - tzv. introducer
    ověřit nastavení znakových sad lze pro tabulku a sloupce takto: show create table table_name; a pro databázi takto: show create database database_name; .

    Schematický popis zpracování dat - konverze znakových sad

    c_s je zkratkou pro: character_set
    1. klient pošle data serveru
    2. server provede konverzi z c_s_client do c_s_connection (nekonvertovány řetězce s introducerem)
    3. server provede konverzi z c_s_connection do znakové sady úložiště
    4. server data uloží

    Možné chyby

    Z toho vyplývají následující možné chyby:

    Předpoklad: řetězec "příliš žluťoučký kůň" je kódován v utf8
    • špatná proměnná c_s_connection - chyba při konverzi c_s_client/c_s_connection. Příklad ukazuje možné úskalí při použití set character set a špatně nastavené znakové sady pro databázi.
      
      create database c_s_test character set latin1; 
      use c_s_test;
      create table t1 (data varchar(255)) character set utf8;
      /* znaková sada pro tabulku je utf8 */
      set character set utf8; 
      /* c_s_connection je stále nastavené na latin1 */
      insert into t1 values('příliš žluťoučký kůň');
      select convert(data using utf8) = _utf8'příliš žluťoučký kůň' from t1 limit 1;
      /* chyba - nerovnají se*/
      drop database c_s_test;
      
      
    • špatná proměnná c_s_client - chyba při konverzi c_s_client/c_s_connection. Data pošleme serveru ve špatném kódování.
      
      create database c_s_test character set utf8; 
      use c_s_test;
      create table t1 (data varchar(255)) character set utf8;
      set names utf8; 
      set character_set_client = latin1;
      /* c_s_client je nastaveno na latin1 */
      insert into t1 values('příliš žluťoučký kůň');
      select convert(data using utf8) = _utf8'příliš žluťoučký kůň' from t1 limit 1;
      /* chyba - nerovnají se*/
      drop database c_s_test;
      
      
    • Chyba při konverzi c_s_connection/znaková sada úložiště. Když máme nastavenou špatnou znakovou sadu pro tabulku, tak to taky není ono.
      
      create database c_s_test character set utf8; 
      use c_s_test;
      create table t1 (data varchar(255)) character set latin1;
      /* znaková sada pro tabulku je latin1 */
      set names utf8; 
      insert into t1 values('příliš žluťoučký kůň');
      select convert(data using utf8) = _utf8'příliš žluťoučký kůň' from t1 limit 1;
      /* chyba - nerovnají se*/
      drop database c_s_test;
      
      
    • Špatně nastavená proměnná c_s_results. Porovnání řetězců tentokrát vrátí 1 - data jsou uložena a zpracována bez chyb při konverzi. Schválně je nastavena jiná znaková sada pro character_set_connection. Dochází ke konverzi utf8 -> latin2 -> utf8. Pro tabulku můžete případně zvolit latin2 znakovou sadu a výsledek bude též správný. Výsledkem druhého selectu je ovšem špatná diakritika kvůli špatně nastavené proměnné c_s_results.
      
      create database c_s_test character set utf8; 
      use c_s_test;
      create table t1 (data varchar(255)) character set utf8;
      set names utf8;
      set character_set_connection = latin2;
      set character_set_results = latin1;
      insert into t1 values('příliš žluťoučký kůň');
      select convert(data using utf8) =  _utf8'příliš žluťoučký kůň' from t1 limit 1;
      /* OK vrátí 1*/
      select convert(data using utf8) from t1 limit 1;
      /* výsledkem je špatná diakritika */
      drop database c_s_test;
      
      

    Související dokumenty

    oficiální dokumentace MySQL (externí dokument)
    FAQ na abclinuxu (FAQ)

    Dokument vytvořil: razor, 21.2.2007 21:14 | Poslední úprava: DaBler, 30.10.2012 20:19 | Další přispěvatelé: razor | Historie změn | Zobrazeno: 3787×

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.