Unicode или UTF-8

Unicode
4
Нейтральная
сторона
5
UTF-8
2
Прежде чем писать комментарии или выбрать сторону вы должны авторизироваться!

16-05-2012 22:58 0

Он универсальный, он лучший! Давайте все вместе поприветствуем Уникод!!!

3 комментария
cherepets 16-05-2012 23:02 0

ScienceDiscoverer, Давай. Только сначала 10Гбитный инет мне проведи, ок?

opera.rulez 16-05-2012 23:05 +1

cherepets, Фишка в том, что UTF-8 (которая, кстати, используется на этом сайте) — тоже Unicode. Как выбор стороны в этом холиваре влияет на размер?

ScienceDisco… 16-05-2012 23:05 0

cherepets, Зачем так мелочится? Я могу провести сразу 1000 Гбитный.

16-05-2012 22:59 +6

Холивар не имеет смысла, автор — Frost92. UTF-8 — это одно из байтовых представлений Unicode, наряду с UTF-7, UTF-16, UTF-32, UCS-2, UCS-4, Punycode.

1 комментарий
r619 17-05-2012 04:43 0

opera.rulez, Я уж подумал что это я туплю насчет того что это разные вещи
двухбайтовые кодировки рулят, алсо.

16-05-2012 22:56 0

О чем тут спорить? Меньше места тратит, лучше с совместимостью с разными софтинами.

3 комментария
opera.rulez 16-05-2012 23:24 0

cherepets, Давай оценим занимаемое место.
Один символ в UTF-8 занимает от 1 до 4 байт (если он помещается в диапазон UCS-2) или даже до 6 байт (если автор текста — китаедрочер). Редкая кодировка CESU-8 занимает столько же места, только на входе у неё не сырой Уникод, а UTF-16.

Один символ в UTF-16 занимает 2 байта (если помещается в диапазон UCS-2) или 4 байта (у китаедрочеров).

Один символ в UCS-2 — всегда 2 байта (но китайцы обломались).

Один символ в UCS-4 и в UTF-32 — всегда 4 байта.

Есть ещё UTF-7 и Punycode, у которых размер не регламентирован, потому что алгоритм кодировки безумный, а также расовые китайские кодировки, содержащие все уникодовские символы.

Внимание, вопрос. Что ты называешь Unicode, который больше места занимает и хуже совместим с софтинами?

cherepets 16-05-2012 23:33 0

opera.rulez, Ту, на которой мне приходилось писать строки ибо j2me такие любила. До сих пор эти страшные u с палочками и циферками снятся...

opera.rulez 16-05-2012 23:38 0

cherepets, Я понял, о чём ты. В разных языках программирования ещё разные модификации этого кодирования встречаются. Верстальщикам HTML амперсанды с решётками снятся, сишникам — нули с иксами.

16-05-2012 22:56 +4

Unicode Transformation Format, мудила.

0 комментариев