Bevezető a Karakterkészletekbe és Karakterkódolásba

Ez az oldal egy kis útmutatást ad az internacionalizációhoz azoknak a kezdőknek, akik igazán nem tudják, hogy hol kezdjék.

You can find a selection of more detailed articles using the links to the right. Once you get some ideas from this page, you will probably just use Learn to internationalize, or the site search.

Miről van szó?

A karakterkészlet olyan betűk és szimbólumok gyűjteménye, amiket egy írásrendszerben használunk. Például az ASCII karakterkészlet az angol betűket és szimbólumokat fedi le, az ISO-8859-6 az arabot és az Unicode pedig tartalmazza a földön levő legtöbb élő nyelv karaktereit.

A karakterek egy karakterkészletben egy vagy több byte-ként vannak tárolva a számítógépen. Minden egyes byte vagy byte csoport egy adott karaktert képvisel. A karakterkódolás a kulcs ahhoz, hogy egy bizonyos byte-ot vagy byte csoportot karakterként térképezzen fel a gép és a betűkészlet pedig szövegként jelenítse meg.

Sokféle karakterkódolás létezik. Ha a rossz kódolás van alkalmazva, akkor az eredmény értelmetlen szöveg lesz. Épp ezért fontos, hogy gondosan válasszuk ki a karakterkódolást.

Tudjon meg többet...

Tudjon meg többet felvázolja a karakterkódolás néhány alapkoncepcióját illetve azok fontosságát.

Az Alapvető meghatározások bővebb információval szolgál az Unicode-ról, karakterkészletekről, karakterkódolásról, a dokumentum kódolásáról és a karakter kibúvókról.

A kódolás kiválasztása

Mindenkinek aki tartalmat készít, legyen az író vagy programozó, el kell döntenie hogy melyik karakterkódolást alkalmazza. Az UTF-8 a legnépszerűbb és legajánlottabb, de vannak dolgok amiket érdemes megfontolni mielőtt használni kezdjük.

 

 

Tudjon meg többet...

HTML & CSS fejlesztők

Specifikáció fejlesztők

Szerver beállítás

Kódolás meghatározása és alkalmazása

Ha eldöntöttük melyik kódolást használjuk, akkor nem árt megbizonyosodnunk arról, hogy a megfelelő módon legyen deklarálva.

Olyan technológiákkal mint az XHTML, a kódolás deklarálása nem mindig egyértelmű; szükség van rá hogy megértsük a szabványokat és az attól eltérő módokat, illetve az XML deklaráció hatását.

Emellett meg kell bizonyosodnunk arról is hogy az adatok abban a kódolásban lettek elmentve, amit választottunk, mivel nem elég egyszerűen csak megjelölni a kódban.

Tartalomfejlesztőknek és a webmestereknek továbbá a oda kell figyelni arra is hogy a szerver a tartalmat a megfelelő karakterkódolással tálalja-e, mivel a szerverbeállítások felülírhatják dokumentumon belüli deklarálást.

Kibúvók

A kibúvók használata egy módszer arra hogy egy karaktert csak ASCII szöveg használatával jelenítsünk meg. Ez arra jó, hogy olyan karaktereket jelenítsünk meg amelyek az éppen használt karakterkódolásban nem elérhetőek vagy ha az adott karaktert nem szeretnénk használni (például mert ütközhet a kóddal). Tisztában kell lennünk vele hogy ezek a kibúvók mikor és hogyan használhatóak.

 

 

Web címek

Napjainkban a webcímek szintén tartalmazhatnak ASCII kódolástól eltérő karaktereket. A dolog viszont sokkal összetettebb annál, mint hogy a felhasználó a megfelelő linkre kattint vagy a látott szöveget beírja. A nehéz rész ugyan a böngészőre hárul, de talán érdekelheti, hogy hogyan is működik ez a dolog.

Tudjon meg többet...

HTML & CSS fejlesztők