Diakritika vo výstupe

Nastavenie zachovania diakritiky v GPC (Win-1250) a SEPA XML (UTF-8) výstupoch. Pipeline: transliterácia → znaková sada výstupu.

Čo je to diakritika?

Diakritika sú znaky s dĺžňami, mäkčeňmi, háčikmi a inými doplnkovými značkami — napríklad á, č, š, ž, ř, ů, ď, ť, ň, ľ, ĺ, ô. Tieto znaky sú bežné v slovenčine, češtine, poľštine, maďarčine a ďalších stredoeurópskych jazykoch.

GPC formát tradične používa ASCII (7-bitové kódovanie bez diakritiky). To znamená, že znaky ako á sa prevedú na a, č na c, atď. Nové nastavenie "Zachovať diakritiku" umožňuje ponechať tieto znaky vo výstupe.

Pipeline spracovania

Text prechádza dvoma krokmi v presne definovanom poradí:

Krok Operácia Popis
1 Transliterácia Prevod ne-latinkových písem do latinky (napr. cyrilika → latinka). Nastavuje sa per-pole (Poznámka 1, Meno protistrany, atď.).
2 Znaková sada výstupu Rozhodnutie, či zachovať diakritiku (preserve_diacritics). Ak je vypnuté, diakritika sa odstráni (á → a). Ak je zapnuté, diakritika zostane.
Poradie je dôležité: Najprv sa cyrilika prevedie na latinku (transliterácia), a až potom sa rozhodne o zachovaní diakritiky. Napríklad ЖуковZukov (transliterácia) → Zukov (bez diakritiky, lebo tu žiadna nie je).

Nastavenie

Nastavenie nájdete v upload/edit modáli, v sekcii "Diakritika vo výstupe":

  • Checkbox "Zachovať diakritiku" — ak je zaškrtnutý, výstup bude obsahovať diakritické znaky
  • Ak je odškrtnutý (predvolené), diakritika sa odstráni a výstup bude čistý ASCII

Nastavenie sa dedí z typu súboru. Ak má typ súboru zapnutú diakritiku, nové súbory tohto typu budú mať diakritiku zapnutú automaticky. Hodnotu je možné zmeniť pre každý konkrétny súbor.

Výstupné formáty

Správanie sa líši podľa výstupného formátu:

Nastavenie GPC SEPA XML
Vypnuté (default) ASCII, UTF-8 ASCII, UTF-8
Zapnuté Win-1250 s diakritikou UTF-8 s diakritikou

Pri zapnutej diakritike sa GPC súbor kóduje vo Windows-1250, čo je znaková sada podporujúca stredoeurópske znaky. SEPA XML zostáva v UTF-8, ktoré diakritiku podporuje natívne.

Kompatibilita

Upozornenie: Nie všetky účtovné programy podporujú diakritiku v GPC súboroch. Ak si nie ste istí, nechajte nastavenie vypnuté.
  • Pohoda — Windows-1250 zvládne, diakritiku je možné zapnúť
  • Money S3 — Windows-1250 zvládne, diakritiku je možné zapnúť
  • FlexiBee — SEPA XML zvládne UTF-8 s diakritikou; pre GPC overte podporu

Ak po zapnutí diakritiky vidíte v účtovnom programe nečitateľné znaky, vráťte nastavenie na vypnuté a súbor transformujte znova.

Príklady

Porovnanie výstupu s vypnutou a zapnutou diakritikou:

Vstup Vypnuté (ASCII) Zapnuté (s diakritikou)
Novák Novak Novák
Příliš žluťoučký Prilis zlutoucky Příliš žluťoučký
Жуков (s transliteráciou) Zukov Zukov

Poznámka: Pri cyrilike transliterácia prevedie znaky na latinku bez diakritiky, preto výsledok je rovnaký bez ohľadu na nastavenie diakritiky.