परिचय कैरेक्टर समूह और कूटबन्धन

यह पृष्ठ नए लोगों को वेब अंतर्राष्ट्रीयकरण के कुछ उन्मुखीकरण प्रदान करता है जो वास्तव में नहीं जानते कि कहाँ से शुरू करे। लक्ष्य है कि आपको साइट पर सामग्री आसानी मिले।

You can find a selection of more detailed articles using the links to the right. Once you get some ideas from this page, you will probably just use Learn to internationalize, or the site search.

यह क्या है?

एक वर्ण संग्रह, पत्रों और प्रतीकों के एक संग्रह है जिन्हें एक लेखन प्रणाली में प्रयोग किया जाता है। उदाहरण के लिए, ASCII वर्ण संग्रह अंग्रेजी पाठ के वर्ण और प्रतीकों को शामिल करता है,  ISO-8859-6 कई अरबी लिपि पर आधारित भाषाओं के लिए वर्ण और प्रतीकों की जरूरत को शामिल करता है, और यूनिकोड वर्ण संग्रह दुनिया में अधिकांश भाषाओं और लिपियों के वर्ण और प्रतीकों को शामिल करता है।

एक वर्ण संग्रह में वर्ण एक कंप्यूटर में एक या एक से अधिक बाइट के रूप में जमा हो जाते है। प्रत्येक बाइट या बाइट्स का अनुक्रम एक दिया वर्ण का प्रतिनिधित्व करता है। वर्ण कूटबन्धन एक कुंजी है जो एक विशेष बाइट या बाइट्स का अनुक्रम को विशेष वर्णों का मानचित्र है। जिन्हें फ़ॉन्ट पाठ के रूप में प्रस्तुत करता है।

वर्ण कूटबन्धन कई अलग अलग होती है। अगर गलत एन्कोडिंग स्मृति में बाइट्स पर लागू होता है, परिणाम पाठ दुर्गम हो जाएग। यह इसलिए महत्वपूर्ण है, अगर लोग ने आपकी सामग्री को पढ़ना है, तो आप सही तरीके से इस्तेमाल किया वर्ण कूटबन्धन को लेबल करे।

और जानें...

वर्ण कूटबन्धन एक शुरुवाती के लिए वर्ण कूटबन्धन के बारे में कुछ बुनियादी अवधारणाओं बताते, और तुम्हे क्यों उस कि परवा करनी चाहिए।

आवश्यक परिभाषाएँ यूनिकोड, वर्ण संग्रह, कोडित वर्ण संग्रह, वर्ण कूटबन्धन, दस्तावेज़ वर्ण संग्रह, और वर्ण पलायन के बारे में अधिक जानकारी प्रदान करती है।

एक कूटबन्धन चुनना

हर कोई जो सामग्री बाना रहा है, चाहे सामग्री लेखक या प्रोग्रामर, अवश्य तए करे कि कोन सा कूटबन्धन का उपयोग करे। UTF-8 इन दिनों एक लोकप्रिय संस्तुति है, लेकिन कुछ और भी चीज़ें हो सकती है जिन्हें विचार करना चाहिए हो सकता है इसे उपयोग करने से पहले।

 

 

और जानें...

HTML और सीएसएस लेखकों

कल्पना डेवलपर्स

सर्वर सेटअप

एक कूटबन्धन को घोषित और लागू करना

जब एक बार यह निर्णय हो जाये कि कौन सी कूटबन्धन का उपयोग करना है, सामग्री डेवलपर्स और प्रोग्रामर यह सुनिश्चित करना चाहिए कि उस की सही तरीके से घोषणा की है।

एक प्रौद्योगिकी जेसे की XHTML के साथ, कूटबन्धन घोषणाओं हमेशा सीधा नहीं होता हैं; उस के लिए 'मानकों' बनाम 'कुइर्क्स' मोड को समझने की आवश्यकता होती है, और XML घोषणा के प्रभाव।

आप यह भी सुनिश्चित कर ले कि आपके डेटा आपके चुने होए कूटबन्धन में सहेजा चाहिए, उसे सिर्फ लेबल करना पर्याप्त नहीं है।

सामग्री डेवलपर्स और वेबमास्टरों यह भी सुनिश्चित कर ले कि सर्वर  सही वर्ण कूटबन्ध के साथ सामग्री की घोषणा करे, क्योंकि सर्वर सेटिंग्स दस्तावेज़ की घोषणाओं को ओवरराइड कर सकती हैं।

पलायन

पलायन केवल ASCII पाठ का उपयोग कर वर्ण का प्रतिनिधित्व करने का एक तरीका है। वे उन अक्षर को प्रदान करने का एक तरीका है जो आप वर्ण एन्कोड प्रयोग कर रहे हैं उन में उपलब्ध नहीं हैं, या अन्य कारणों के लिए वर्ण के उपयोग से बचने का एक रास्ता प्रदान करता है (जेसे की जब उनका सिन्टाक्स से टकराव हो). आप को स्पष्ट होना चाहिए कि कब और कैसे इन पलायन इस्तेमाल किया जाना चाहिए.

 

 

वेब पते

इन दिनों वेब पते भी गैर-ASCII वर्ण शामिल कर सकते हैं. उपयोगकर्ता उपयुक्त लिंक पर क्लिक करने के अलावा या पाठ दर्ज करता है जिस रूप में वे उसे देखते है, भार उठाने का काम उपयोगकर्ता का एजेंट द्वारा किया जाता है, लेकिन कि यह कैसे काम करता है इसे जान्ने में आपकी रुचि हो सकती है।

विशिष्टता डेवलपर्स को अपने विनिर्देशों को एस तरहं डिजाइन करना चाहिए ताकि गैर-ASCII वेब पते में इस्तेमाल किया जा सके।

और जानें...

HTML और सीएसएस लेखकों