Kodowania umożliwiają określenie kodowania znaków, w jakim utworzono tekst.
W instrukcji określającej kodowanie pliku XML lub dyrektywie określającej zestaw znaków w pliku HTML używana jest nazwa IANA.
Edytory HTML i XML obsługują następujące kodowania:
Kodowanie XML (nazwa IANA) |
Opis |
---|---|
BIG5 |
Big5, chiński tradycyjny |
EUC-JP |
EUC, japoński |
EUC-KR |
EUC, koreański |
GB2312 |
GBK, chiński uproszczony |
GB18030 | standard narodowy, chiński |
IBM864 | arabski PC Arabic (kodowanie nieobsługiwane przez stronę Projekt programu Page Designer) |
ISO-2022-JP |
ISO 2022, japoński |
ISO-2022-KR |
ISO 2022, koreański |
ISO-8859-2 |
ISO Latin-1 (zachodnioeuropejski) |
ISO-8859-2 | środkowoeuropejski/wschodnioeuropejski (słowiański) |
ISO-8859-3 | południowoeuropejski |
ISO-8859-4 | ISO 8859-4, cyrylica |
ISO-8859-5 | ISO 8859-5, cyrylica |
ISO-8859-6 |
arabski (logiczny) |
ISO-8859-7 | grecki |
ISO-8859-8-I |
hebrajski (logiczny) |
ISO-8859-8 |
hebrajski (wizualny) (kodowanie obsługiwane, ale nieobsługiwane przez stronę Projekt programu Page Designer) |
ISO-8859-9 | turecki |
SHIFT_JIS |
Shift-JIS, japoński |
TIS-620 | TISI, tajski |
US-ASCII |
US ASCII |
UTF-8 |
ISO 10646/Unicode, kodowanie jednobajtowe |
UTF-16 |
ISO 10646/Unicode, kodowanie dwubajtowe |
UTF-16BE |
Unicode w układzie big endian |
UTF-16LE |
Unicode w układzie little endian |
WINDOWS-874 | tajski, Microsoft |
WINDOWS-1252 |
ISO Latin-1 (zachodnioeuropejski) |
WINDOWS-1255 |
hebrajski |
WINDOWS-1256 |
arabski |
X-EUC-JP | kodowanie EUC, japoński (alias dla EUC-JP) |
X-SJIS | Shift-JIS, japoński (alias dla SHIFT_JIS) |