/UTF-16

Z Brain-wiki
Wersja z dnia 14:38, 23 maj 2015 autorstwa Jarekz (dyskusja | edycje) (Utworzono nową stronę "= TI:WTBD/UTF-16 = Reprezentacja ciągu znaków z Unicode w postaci ciągu słów 16-bitowych, taka że wszystkie punkty kodowe z BMP (w granica...")
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)

TI:WTBD/UTF-16

Reprezentacja ciągu znaków z Unicode w postaci ciągu słów 16-bitowych, taka że wszystkie punkty kodowe z BMP (w granicach wartości 16-bitowych) są reprezentowane przez słowa o wartości numerycznej równej wartości odp. kodów, a punkty kodowe ponad 0xFFFF (spoza BMP) reprezentowane są przez tzw. //pary surogatów//. Dość sprytny algorytm opisany jest tu, korzysta on z faktu pozostawienia przedziału wartości zastrzeżonych (bez przydzielonych znaków) w zakresie 0xD800 .. 0xFFFF.

UTF-16 znajduje spore zastosowanie w praktyce. Pewne trudności powoduje fakt, że słowa 16-bitowe mogą być składane z bajtów albo stawiając najpierw bajt ,,starszy" (big-endian), albo najpierw ,,młodszy" (little-endian). Stąd wziął się tzw. Byte Order Mark.