/Rozszerzenia8Bitowe
Spis treści
TI:WTBD/Rozszerzenia8Bitowe
Strony kodowe DOS/Windows
W oryginalnym IBM-PC na rynek USA wprowadzono stronę kodową CP437. Różni się ona od ASCII wprowadzeniem symboli graficznych odpowiadających kodom kontrolnym i wypełnieniem zakresu 128 .. 255 (tzn. z ustawionym najstarszym bitem) pewnym repertuarem liter akcentowanych, dodatkowych znaków specjalnych (np. podzbioru liter greckich i kilku symboli matematycznych) oraz tzw. znaków semigraficznych (ramek itp.). Było to trochę bez składu, bo np. użyty repertuar liter akcentowanych nie wystarczał dla żadnego języka nieangielskiego.
Później na rynki obcojęzyczne wprowadzono odrębne strony kodowe (IBM/Microsoft), z bardziej adekwatnymi zestawami liter. Np. w Polsce funkcjonowała strona kodowa CP852, w Europie Zachodniej -- CP850. W szerokim użyciu było też konkurencyjne, ,,domorosłe" kodowanie [1].
Wraz z Windows Microsoft wprowadził na polski rynek nową stronę kodową CP1250, dostosowaną również do szeregu innych języków Europy Środkowo-Wschodniej. Jej odpowiednikiem na Zachodzie była CP1252. CP1250 była i jest oczywiście niezgodna z oficjalną polską normą, opartą na ISO-8859-2.
Rodzina kodowań ISO-8859-x
Oficjalna norma kodowania 8-bitowego dla alfabetów pochodnych od łacińskiego, końcówka (x = 1, 2, ...) określa grupę języków. Niestety Microsoft postanowił się do niej nie stosować, ale w dokumentach internetowych stosowane dość szeroko.
Pozostawiają w spokoju zakres ASCII, wypełniając tylko (każda tablica inaczej) tzw. górną połówkę (wartości kodów od 128 do 255).
Słabości
Przede wszystkim w jednej tablicy kodowej 8-bitowej jest za mało miejsca na znaki potrzebne wszystkim językom, nawet tylko tym, które używają pochodnych alfabetu łacińskiego. Czyli teksty w różnych językach trzeba kodować za pomocą różnych, wzajemnie niekompatybilnych tablic kodowych -- co m. in. wyklucza dokumenty wielojęzyczne. No i pozostawiają na marginesie inne systemy pisma -- mimo istnienia dość nienaturalnych dostosowań do cyrylicy, greki i hebrajskiego.
Dużą słabością w praktyce był też de facto brak standaryzacji, nawet w zakresie pojedynczego języka (np. w Polsce).