Kad HTML puslapis būtų atvaizduotas tvarkingai, naršyklė turi žinoti kokią simbolių koduotę jai reikia naudoti. Seniau visur buvo naudojama ASCII koduotė, kuri palaiko skaičius nuo 0 iki 9 ir angliškas raides. Kai technologijos vystėsi, pradėjo nepakakti ASCII koduotėje esančių simbolių, todėl buvo išrastos kitos koduotės.
Dabar pagal nutylėjimą daugumoje naršyklių yra naudojama ISO-8859-1 koduotė, jei norite naudoti kitą koduotę - tam reikia įterpti html tagą, kuris nurodytų kokią koduotę naudojate puslapyje.
ISO - International Standards Organization, tai organizacija kuri nurodo koduočių standartus skirtingiems raidynams ar kalboms. Šioje lentelėje matote ISO koduotes:
Koduotė | Aprašymas | Kokias kalbas palaiko |
---|---|---|
ISO-8859-1 | Lotyniškas raidynas. 1 dalis | Šiaurės Amerika, Vakarų Europa, Lotynų Amerika, Karibai, Kanada ir Afrika |
ISO-8859-2 | Lotyniškas raidynas. 2 dalis | Rytų Europa |
ISO-8859-3 | Lotyniškas raidynas. 3 dalis | PR Europa, Esperanto ir keletas kitų |
ISO-8859-4 | Lotyniškas raidynas. 4 dalis | Skandinavijos / Baltijos šalys (ir keletas kitų, kurios nepatenka į ISO-8859-1) |
ISO-8859-5 | Lotyniškas/Kirilicos raidynas. 5 dalis | Kalbos, kurios naudoja kirilica. Pavyzdžiui Bulgarija, Baltarusija, Rusija ir Makedonija |
ISO-8859-6 | Lotyniškas/Arabiškas raidynas. 6 dalis | Kalbas, kurios naudoja arabų abėcėlę |
ISO-8859-7 | Lotyniškas/Graikiškas raidynas. 7 dalis | Šiuolaikinę graikų kalbą, taip pat matematinius simbolius, kuri buvo perimti iš graikų abėcėlės |
ISO-8859-8 | Lotyniškas/Hebrajiškas raidynas. 8 dalis | Kalbos, kurios naudoja Hebrajų abėcėlę |
ISO-8859-9 | Lotyniškas raidynas. 9 dalis | Turkiški simboliai. |
ISO-8859-10 | Lotyniškas raidynas. 10 dalis | Lapų, Šiaurės, Šiaurės eskimų kalbos |
ISO-8859-15 | Lotyniškas raidynas. | Panašus į ISO 8859-1, tik palaiko keletą retų simbolių, tokių kaip euro ženklas ir dar keletą kitų |
ISO-2022-JP | Lotyniškas/Japoniškas raidynas. 1 dalis | Japonų kalbai |
ISO-2022-JP-2 | Lotyniškas/Japoniškas raidynas. 2 dalis | Japonų kalbai |
ISO-2022-KR | Lotyniškas/Korėjietiškas raidynas. 1 dalis | Korėjiečių kalbai |
Kaip pastebėjote, ISO koduotės palaiko vieną ar kitą kalbą, kai kurios tam tikrą regioną. Šiais laikais dažnai reikia puslapyje naudoti simbolius iš skirtingų kalbų, tam buvo sukurta unicode koduotė. Ši koduotė palaiko visus simbolius, iš visų kalbų. Ši koduotė gali būti taikoma visur, nesvarbu kokia tai programa, kompiuterinė platforma ar kalba.
Unicode Konsorciumas sukūrė unicode standartą. Jų uždavinys yra sukurti koduotę, kuri palaikytų visus simbolius. Jų koduotė dar vadinama UTF - Unicode Transformation Format.
Unicode standartas buvo pripažintas visų programavimo kalbų ir operacinių sistemų, ją palaiko visos šiuolaikinės naršyklės.
Unicode Konsorciumas dirba kartu su kitomis organizacijomis, kurios patvirtina standartus, tokiomis kaip ISO, W3C ir ECMA.
Internete yra naudojama UTF-8 koduotė. Visi HTML 4 procesoriai palaiko UTF-8, taip pat vii XHTML ir XML procesoriai palaiko UTF-8 ir UTF-16. Skaičius parodo keliais bitais bus koduojama.
Kai kuriate puslapį, galite naudoti tokią html žymę ir neturėtų kilti bėdų su simbolių kodavimu: