Znak ustawiony w HTML
Istnieje wiele zestawów znaków, które były używane we wcześniejszych wersjach HTML. Tutaj omówimy wszystkie wcześniej i aktualnie obsługiwane zestawy znaków.
Zestaw znaków ASCII
ASCII to 7-bitowy zestaw znaków, który pozwala 128 znakom reprezentować terminy języka angielskiego w zrozumiałym formacie komputerowym. Niektóre cechy ASCII opisano poniżej:
- Cyfry (0-9) i wszystkie 26 liter alfabetycznych można reprezentować za pomocą ASCII
- Wszystkie zestawy znaków używane w HTML są oparte na ASCII
Głównym ograniczeniem zestawu znaków ASCII jest to, że obsługuje on tylko 128 znaków, które mogłyby obsługiwać tylko terminy języka angielskiego (alfabety), cyfry (0-9) i znaki interpunkcyjne. zależne od języka i ograniczone.
Zestaw znaków ISO 8859-1
Z najnowszych wersji HTML 4.0 Wymyśliłem ISO-8859-1 jako domyślny zestaw znaków. ISO 8859-1 jest przedłużeniem zestawu znaków ASCII i reprezentuje znaki w kodzie 8-bitowym. Może reprezentować 256 znaków, co sprawia, że jest to uzależniony od języka schemat kodowania. Zestaw znaków jest zdefiniowany w meta tagu dokumentu HTML, a następujący kod pomoże w użyciu ISO 8859-1 w dokumencie HTML:
Notatka: Chociaż HTML5 zawiera zestaw znaków UTF-8, można go również używać z ISO-8859-1 za pomocą następującej linii w znaczniku głowy.
Zestaw znaków UTF-8
Zestaw znaków Unicode obejmuje wartości dziesiętne reprezentujące znaki, symbole i znaki interpunkcyjne. Te wartości dziesiętne oparte na Unicode są następnie konwertowane na zrozumiały komputerowy format za pomocą UTF-8, UTF-16 lub UTF-32. Jednak UTF-8 jest zalecany dla stron internetowych, ponieważ obejmuje wszystkie znaki/symbole/znaki interpunkcyjne, które mogą być używane w dokumencie HTML.
Poniżej znajdują się istotne cechy UTF-8
- Najnowszy zestaw postaci był domyślnie dla HTML5.
- Można go również dodać do wersji HTML4.
- UTF-8 działa na podstawie ASCII, a pierwsze 128 znaków w UTF-8 są takie same jak ASCII.
- Obsługuje wszystkie symbole, postacie i znaki interpunkcyjne używane na całym świecie
- Konwertuje liczby/znaki/symbole/znaki interpunkcyjne w od 1 do czterech bajtów
Z powyższej dyskusji znaczenie UTF-8 stanowiło solidne podstawy do przestarzałych zestawów ASCII i ISO-8859-1-Character.
Notatka: Unicode.Org zapewnia wszystkie jednoCode postaci, symbole, emoji, znaki interpunkcyjne.
Jak używać UTF-8 w HTML4
HTML4 był wyposażony w ISO-889-1 jako domyślny zestaw znaków. Możesz jednak dodać zestaw znaków UTF-8 w HTML4, używając następującego metatagu.
Jak używać ISO-8859-1 w HTML5
Ponieważ domyślny zestaw znaków HTML5 jest UTF-8, który przewyższa starsze zestawy znaków. Możesz jednak dodać zestaw znaków ISO-8859-1 w dokumencie HTML za pomocą następującego wiersza w naszym znaczniku głowy.
Wniosek
Zestaw znaków konwertuje symbole, znaki lub dowolne klawisze w formacie odczytującego komputer. Ten artykuł zawiera przegląd zestawów znaków używanych w HTML, zaczynając od wcześniejszych wersji do najnowszych HTML5. ASCII jest najstarszym zestawem postaci z ograniczonym wsparciem dla postaci i języka (tylko język angielski). Później ASCII zostało rozszerzone do 256 znaków o 8-bitowej obsługi, aby zbudować nowy zestaw znaków o nazwie ISO-8859-1. ISO-8859-1 jest domyślnym zestawem znaków dla HTML4, ale oferuje ograniczone wsparcie znaków (256). UTF-8 obejmuje wszystkie niedobory ISO-8859-1, a zatem UTF-8 pojawił się jako domyślny znak ustawiony w HTML5.