Introduktion till teckenuppsättningar och kodningar

Denna sida ger lite vägledning till de som nyligen stött på internationalisering på webben, och som inte riktigt vet hur man ger sig i kast med detta. Avsikten med denna sida är att på ett lättförståeligt sätt ge ingångar till annat material på denna webbplats.

You can find a selection of more detailed articles using the links to the right. Once you get some ideas from this page, you will probably just use Learn to internationalize, or the site search.

Vad handlar detta om?

En teckenuppsättning är en samling bokstäver och symboler som används i ett skriftsystem. Som exempel kan nämnas ASCII:s teckenuppsättning som innehåller bokstäver och symboler för engelsk text, ISO-8859-6 som är tecken och symboler vilka används i många språk baserade på arabiskt skriftsystem, och Unicodes teckenuppsättning som innehåller tecken för de flesta nu levande språk och skriftsystem i världen.

Tecken i en teckenuppsättning lagras som en eller flera byte i en dator. Varje byte eller sekvens av bytes representerar ett visst tecken. En teckenkodning är en nyckel som avbildar en viss byte eller sekvens av bytes till ett visst tecken, vilket med ett typsnitt kan presenteras som text.

Det finns många olika teckenkodningar. Om en felaktig kodning appliceras på de bytes som finns i datorns minne, så kan resultatet bli oförståelig text. För att människor ska kunna läsa ditt innehåll, så är det viktigt att du anger den teckenkodning som faktiskt används.

Mer information om...

Teckenkodning för nybörjare förklarar några grundläggande begrepp om teckenkodning, och varför du bör tänka på sådant.

Teckenkodningar: grundläggande begrepp ger förklaringar av terminologi, som Unicode, teckenuppsättningar, kodade teckenmängder, teckenkodningar, dokuments teckenuppsättning, och specialsekvenser.

Att välja en kodning

Alla som utvecklar innehåll, såväl innehållsförfattare som programmerare, måste fatta ett beslut om vilken teckenkodning som ska användas. Numera rekommenderas användning av UTF-8, men det finns ändå vissa saker du bör tänka på innan du använder den.

 

 

Mer information om...

Arbeta med HTML & CSS

Utvecklare av specifikationer

Konfigurera en server

Deklarera och använda en kodning

När man väl beslutat vilken kodning som skall användas, så måste innehållsutvecklare och programmerare säkerställa att den deklareras på ett korrekt sätt.

Med teknologi som XHTML så finns det en del att tänka på: man måste förstå 'standards' vs. 'quirks' modes, och XML-deklarationens effekter.

Du måste också säkerställa att dina data lagras i den kodning du valt, det räcker inte med att bara etikettera den.

Innehållsutvecklare och webbansvariga måste även fastställa att webbservern levererar innehåll med korrekt deklaration av teckenkodning, eftersom de inställningar som servern anger är viktigare än deklarationer i dokumentet självt.

Specialsekvenser

Specialsekvenser är ett sätt att med ASCII-text representera ett tecken. Med sådana sekvenser kan man representera tecken som inte finns i den teckenkodning du använder, eller då du av andra skäl måste undvika att använda tecknet (t.ex. då det inte tillåts av uppmärkningens syntax). Du bör ha klart för dig under vilka omständigheter dessa specialsekvenser bör användas.

 

 

 

Webbadresser

Idag kan webbadresser även innehålla tecken som inte ingår i ASCII. Användaren behöver inte göra mer än klicka på en länk, eller skriva in den text som de ser - själva jobbet utförs av webbläsaren - men du kan vara intresserad av att veta hur det fungerar.

Utvecklare av specifikationer bör konstruera sina specifikationer så att man kan använda webbadresser vilka innehåller tecken som inte ingår i ASCII.

Mer information om...

Arbeta med HTML & CSS