介紹字符集與編碼

對於那些對網絡國際化不知從何入手的新手﹐本網頁提供了基本指導﹐期望助其輕鬆地逐漸了解﹑認識和使用网上資料。

You can find a selection of more detailed articles using the links to the right. Once you get some ideas from this page, you will probably just use Learn to internationalize, or the site search.

什麼是字符集﹖編碼有何用途﹖

字符集是書寫系統字母與符號的集合。例如,ASCII 字符集包括英語字母、符號;ISO-8859-6字符集包括許多基於阿拉伯語言文字的字母、符號;Unicode 字符集涵蓋世界上多數活語言文字字符。

字符集裡的字符在計算機中存儲為一個或多個字節﹐每一個或每一序列字節代表一特定字符。字符編碼關鍵在將一特定字節或序列字節編碼對應 ( 映射 )以文本字體顯示的特定字符。

現有許多不同類型的字符編碼。 如果錯用了與存儲字節不一致的編碼﹐ 結果就是亂碼。所以﹐如要文字內容可以閱讀﹐則要正確標注字符編碼﹐這很重要。

了解更多...

字符編碼入門 解釋了字符編碼的某些基本概念,以及為什麼你應注意字符編碼。

字符編碼相關基本定義 解釋了Unicode﹑ 字符集﹑編碼字符集﹑字符編碼﹑文檔字符集﹑字符轉義等術語。

編碼的選擇

每個開發人員﹐無論是內容創作或編程﹐都必須事先決定使用哪一種字符編碼。現時﹐大多推薦用UTF-8﹐但仍會有其它因素需要考慮﹐方可定奪。

 

 

 

了解更多...

HTML & CSS 編輯人員

規範開發人員

服务器设置

聲明和應用編碼

一旦決定使用何种編碼,內容創作者和程序員必須确保此編碼要正确地予以聲明。

在象XHTML這一類的技術中,編碼聲明并非總是直接了當的,這就需要正確理解“標准”模式与“非標”模式, 也要理解XML聲明的作用。

僅予標註還不夠, 你還須确保數据以選定編碼存貯。

內容開發人員和网站管理員也要确保服務器能夠以正确的字符編碼聲明傳遞內容,因為服務器的設置將會覆蓋文檔中的聲明。

 

轉義

轉義是一種方法﹐即只用ASCII文本方式來表示某個字符﹐可用來表示所用編碼中沒有的字符﹐或因其他原因(比如它們可能與句法衝突)需避免使用的字符。你應該清楚何時及如何使用轉義。

 

 

 

 

了解更多...

HTML & CSS 編輯人員

SVG 編輯人員

XML 編輯人員

規範開發人員

網址

現時網址也可包括非ASCII字符﹐用戶只需點擊相應的鏈接或輸入所見文字﹐其主要編碼任務皆由用戶代理完成﹐但你可能有興趣了解這是如何實現的。

規范開發人員應制訂相應規範以便人們能夠正常使用非ASCII的网址。

了解更多...

HTML & CSS 編輯人員