Представлення наборів символів і кодування

Ця сторінка орієнтує новачків у веб інтернаціоналізації, які дійсно не знають з чого почати. Мета - полегшити розуміння деяких матеріалів на сайті.

You can find a selection of more detailed articles using the links to the right. Once you get some ideas from this page, you will probably just use Learn to internationalize, or the site search.

Що це таке?

Набір символів - набір букв і символів, що використовуються для писання. Наприклад, набір символів ASCII охоплює букви і символи для англійськомовного тексту, ISO-8859-6 охоплює букви і символи, необхідні для багатьох мов, що основані на арабському скрипті, і набір символів Unicode містить символи для більшості існуючих мов і скриптів світу.

Символи в наборі символів зберігаються у вигляді одного або декількох байтів на комп'ютері. Кожен байт або послідовність байтів представляє обумовлений символ. Кодування символів розподіляє окремий байт або послідовність байтів в окремі символи, які відображаються шрифтом, як текст.

Є багато різних кодувань символів. Якщо неправильне кодування застосовується до байтів у пам'яті, то в результаті буде незрозумілий текст. Щоб люди могли читати ваш контент, важливо правильно вибрали кодування символів.

Дізнайтесь більше...

Кодування символів для початківців пояснює деякі основні поняття про кодування символів, і навіщо вам це потрібно.

Основні визначення, пов'язані з кодуваннями пояснює такі терміни, як Unicode, набори символів, кодування наборів символів, кодування символів, набір символів документа, і екрановані символи.

Вибір кодування

Кожен розробник контенту, будь то автор або програміст, повинен вирішити яке кодування символів він буде використовувати. На сьогоднішній день рекомендують використовувати кодування UTF-8 , але все ще можуть бути речі, які ви повинні розглянути перед її використанням.

 

 

Дізнайтесь більше...

Автори HTML і CSS

Розробники специфікацій

Установки сервера

Призначення і примінненя кодування символів

Як тільки було вирішено, яке кодування використовувати, розробники контенту і програмісти повинні переконатися, що воно правильно призначене.

В XHTML, призначити кодування не просто; потрібно розуміти 'стандартний' режим в порівнянні з режимом 'сумісності' , і вплив XML призначення.

Ви також повинні переконатися, що ваші дані зберігаються в кодуванні, яке ви вибрали, не досить тільки назвати його.

Розробникам контенту та веб-майстрам необхідно буде переконатися, що сервер передає контент з правильним кодуванням символів , бо налаштування сервера можуть відкидати призначення записані у вашому документі.

Екрановані символи

Екрановані символи - використовуються для відображення символів, використовуючи тільки текст ASCII. Вони є засобом відображення символів, які не доступні в кодуванні, що ви використовуєте, допомагають уникнути використання символів з інших причин (наприклад, коли вони можуть конфліктувати з синтаксисом). Ви повинні зрозуміти, коли і як слід використовувати ці екрановані символи.

 

 

 

Веб адреси

На сьогоднішній день веб адреси можуть містити non-ASCII символи. Користувач робить трохи інше, ніж натискає на відповідному посиланні або вводить текст, так як він його бачить, важку роботу виконує клієнтський додаток (пошуковий робот), але вас може зацікавити, як це працює.

Розробники специфікацій повинні проектувати їх так, щоб можна було використовувати non-ASCII символи у веб адресах.

Дізнайтесь більше...

Автори HTML і CSS