System Unicode w Javie

System Unicode w Javie
Języki programowania są zgodne z zestawem standardów kodowania znaków. Normy te reprezentują języki pisane i definiują niektóre reguły, które należy przestrzegać w celu kodowania znaków należących do tych języków pisemnych. Podobnie jak inne języki programowania, Java ma również standard kodowania znaków, który jest określany jako system Unicode. Ten post rzuca światło na system Java Unicode.

Co to jest system Unicode?

Unicode System to światowy standard używany do kodowania 16-bitowych znaków. Ten system może reprezentować prawie każdy znany język świata.

Dlaczego system Unicode?

Przed pojawieniem się systemu Unicode było wiele standardów używanych do kodowania znaków. One były:

  1. ASCII
    ASCII, skrót od amerykańskiego standardowego kodu informacji o wymianie informacji jest jednym z najstarszych i najczęstszych standardów kodowania znaków i zawiera litery A-Z (wielkie i małe i małe litery), jak i numer 0-9 oraz niektóre podstawowe symbole.
  2. ISO 8859-1
    ISO 8859-1 to standard opracowany dla języka zachodniego Europy, który obejmuje 128 znaków ASCII, a także 128 dodatkowych znaków.
  3. KOI-8
    KOI-8 to standard pierwotnie opracowany dla rosyjskiego, który umożliwia kodowanie 8-bitowych znaków i obejmuje alfabety łacińskie i alfabety rosyjskie (wielkie i małe i małe litery).
  4. GB 18030 i BIG-5
    GB 18030 i BIG-5 to standardy opracowane dla Chińczyków. GB18030 reprezentuje wszystkie 20 902 znaków Han i dodatkowe symbole DBCS, tymczasem, BIG5, reprezentuje konwencjonalne chińskie znaki.

W wyżej wymienionych standardach problem, który wystąpił, polegał na tym, że określona wartość kodu została użyta do przedstawienia różnych znaków w wielu językach. Ponadto większe kodowanie zestawu znaków dla różnych języków o różnej długości, takich jak 1 bajt, 2 bajty lub więcej.

W celu rozwiązania tego problemu opracowano system Unicode dla języków. Każda postać w tym systemie utrzymuje 2 bajt w bajcie Java 2 jest używany dla każdego znaku.

Wniosek

Unicode System to globalny standard używany do kodowania znaków 16-bitowych znaków. Powstał jako rozwiązanie problemów, które miały miejsce w wcześniej opracowanych standardach językowych. Java używa tego systemu zaprojektowanego do przechowywania 2 bajtów dla każdego znaku. W tym poście szczegółowo omawia system Java Unicode.