Daily Archive for 14 December:РП: 2005 года

Кодировки-кодировочки

Денис Перехрест ненавидит кодировку windows-1251.

Скорее всего, он просто не умеет её готовить :)

По своему опыту знаю, что windows-1251 — это ещё не самое страшное зло. Гораздо страшнее, например, плеяда CJK-кодировок: GB2312, GBK, GB18030, EUC-TW, Big5, Shift_JIS, EUC-JP… Например, если открыть файл в кодировке windows-1251, как koi8-r сразу же станет ясно, что выбрана неправильная кодировка, тоже самое, если открыть utf-8, как iso-8859-1, но это абсолютно не так в случае с CJK-кодировками — они все показывают иероглифы (правда, каждый раз разные), поэтому если кодировка не указана явно, то догадаться о ней невозможно не только человеку (если он конечно не знаток языка), но и php mb_detect_encoding.

Continue reading ‘Кодировки-кодировочки’