Diakritika vo výstupe
Nastavenie zachovania diakritiky v GPC (Win-1250) a SEPA XML (UTF-8) výstupoch. Pipeline: transliterácia → znaková sada výstupu.
Čo je to diakritika?
Diakritika sú znaky s dĺžňami, mäkčeňmi, háčikmi a inými doplnkovými značkami — napríklad á, č, š, ž, ř, ů, ď, ť, ň, ľ, ĺ, ô. Tieto znaky sú bežné v slovenčine, češtine, poľštine, maďarčine a ďalších stredoeurópskych jazykoch.
GPC formát tradične používa ASCII (7-bitové kódovanie bez diakritiky). To znamená, že znaky ako á sa prevedú na a, č na c, atď. Nové nastavenie "Zachovať diakritiku" umožňuje ponechať tieto znaky vo výstupe.
Pipeline spracovania
Text prechádza dvoma krokmi v presne definovanom poradí:
| Krok | Operácia | Popis |
|---|---|---|
| 1 | Transliterácia | Prevod ne-latinkových písem do latinky (napr. cyrilika → latinka). Nastavuje sa per-pole (Poznámka 1, Meno protistrany, atď.). |
| 2 | Znaková sada výstupu | Rozhodnutie, či zachovať diakritiku (preserve_diacritics). Ak je vypnuté, diakritika sa odstráni (á → a). Ak je zapnuté, diakritika zostane. |
Nastavenie
Nastavenie nájdete v upload/edit modáli, v sekcii "Diakritika vo výstupe":
- Checkbox "Zachovať diakritiku" — ak je zaškrtnutý, výstup bude obsahovať diakritické znaky
- Ak je odškrtnutý (predvolené), diakritika sa odstráni a výstup bude čistý ASCII
Nastavenie sa dedí z typu súboru. Ak má typ súboru zapnutú diakritiku, nové súbory tohto typu budú mať diakritiku zapnutú automaticky. Hodnotu je možné zmeniť pre každý konkrétny súbor.
Výstupné formáty
Správanie sa líši podľa výstupného formátu:
| Nastavenie | GPC | SEPA XML |
|---|---|---|
| Vypnuté (default) | ASCII, UTF-8 | ASCII, UTF-8 |
| Zapnuté | Win-1250 s diakritikou | UTF-8 s diakritikou |
Pri zapnutej diakritike sa GPC súbor kóduje vo Windows-1250, čo je znaková sada podporujúca stredoeurópske znaky. SEPA XML zostáva v UTF-8, ktoré diakritiku podporuje natívne.
Kompatibilita
- Pohoda — Windows-1250 zvládne, diakritiku je možné zapnúť
- Money S3 — Windows-1250 zvládne, diakritiku je možné zapnúť
- FlexiBee — SEPA XML zvládne UTF-8 s diakritikou; pre GPC overte podporu
Ak po zapnutí diakritiky vidíte v účtovnom programe nečitateľné znaky, vráťte nastavenie na vypnuté a súbor transformujte znova.
Príklady
Porovnanie výstupu s vypnutou a zapnutou diakritikou:
| Vstup | Vypnuté (ASCII) | Zapnuté (s diakritikou) |
|---|---|---|
| Novák | Novak | Novák |
| Příliš žluťoučký | Prilis zlutoucky | Příliš žluťoučký |
| Жуков (s transliteráciou) | Zukov | Zukov |
Poznámka: Pri cyrilike transliterácia prevedie znaky na latinku bez diakritiky, preto výsledok je rovnaký bez ohľadu na nastavenie diakritiky.