डेढ़ दशक बाद भी कितने लोग जानते हैं यूनिकोड को!

डेढ़ दशक बाद भी कितने लोग जानते हैं यूनिकोड को!

हिंदी में पिछले एक दशक के आसपास की अवधि में सूचना प्रौद्योगिकी क्षेत्र में हुई ज्यादातर तरक्की शायद नहीं हो पाती, अगर यूनिकोड नाम की सौगात हमारी भाषा को न मिली होती। यूनिकोड ने देवनागरी लिपि में पाठ इनपुट करने, सहेजने, डिजिटल माध्यमों से एक से दूसरी जगह भेजने, सूचनाओं का प्रसंस्करण करने, आउटपुट प्रदान करने जैसी प्रक्रियाओं के प्रत्यक्ष-अप्रत्यक्ष मानकीकरण में योगदान दिया है। भले ही हिंदी टंकण को लेकर आज भी संशय बरकरार है और लोग इनस्क्रिप्ट, ट्रांसलिटरेशन तथा रेमिंगटन के तौर-तरीकों का इस्तेमाल करते हुए देवनागरी में कंप्यूटर पर टंकण कर रहे हैं, लेकिन कम-से-कम टेक्स्ट इनपुट किए जाने के बाद की स्थिति काफी हद तक मानकीकरण के सिद्धांतों का पालन करती है।

इसका तात्पर्य यह हुआ कि भले ही आप अपने देवनागरी टेक्स्ट को रोमन की-बोर्ड का इस्तेमाल करते हुए ट्रांसलिटरेशन के जरिए देवनागरी में बदलकर टाइप करें या फिर सीधे इनस्क्रिप्ट/रेमिंगटन कीबोर्ड के माध्यम से कंप्यूटर/डिजिटल प्रणालियों में इनपुट करें, एक बार टाइप होने के बाद आपकी लिखी इबारत मानकीकृत यूनिकोड टेक्स्ट के रूप में सहेजी जाती है। एक बार टाइप होने और भंडारित किए जाने के बाद यह पाठ मानकीकृत हो जाता है। उसके बाद इसे विंडोज में इस्तेमाल करें या फिर मैकिनटोश कंप्यूटरों पर खोलें, टैबलेट में पढ़ें या फिर स्मार्टफोन पर प्रयुक्त करें (संबंधित गैजेट या ऑपरेटिंग सिस्टम में मौजूद हिंदी यूनिकोड फॉण्ट के अनुरूप), वह प्रायः समान दिखाई देता है। यह यूनिकोड की शक्ति है, जिसने हिंदी और देवनागरी को समृद्ध किया है और उन्हें उस तकनीकी विचलन से मुक्त किया है, जिसकी वजह से इस भाषा और लिपि में कार्य करनेवाले लोग अलग-अलग पद्धतियों से टंकण करने, अलग-अलग फॉण्टों का प्रयोग करने और अलग-अलग सॉफ्टवेयरों पर निर्भर होने के लिए मजबूर थे। विभिन्न ऑपरेटिंग सिस्टमों (विंडोज, मैक और लिनक्स आदि) की तो बात ही छोड़िए, एक ही कंप्यूटर पर अलग-अलग हिंदी सॉफ्टवेयरों का प्रयोग करते हुए देवनागरी में टंकित की गई सामग्री दूसरे सॉफ्टवेयर के लिए जंक या गारबेज (पढ़ी या समझी न जा सकनेवाली उल्टी-पुल्टी इबारत) मात्र बन जाती थी। वह भी छोड़िए, एक हिंदी फॉण्ट में टंकित सामग्री दूसरे हिंदी फॉण्ट का प्रयोग करने पर अर्थहीन हो जाती थी।

सो यूनिकोड ने हिंदी और देवनागरी का बहुत भला किया है। यों यूनिकोड के आगमन को लगभग ढाई दशक बीत चुके हैं। माइक्रोसॉफ्ट एक्सपी और विंडोज २००० में हिंदी में यूनिकोड में कामकाज की शुरुआत हो गई थी। जाहिर है, हिंदी में यूनिकोड का विधिवत् प्रयोग करते हुए भी हमें डेढ़ दशक की अवधि बीत चुकी है। लेकिन सामान्य हिंदी कंप्यूटर प्रयोक्ताओं के बीच आज भी उसके बारे में जागरूकता का अभाव है। यह आश्चर्यजनक भी है और खेदपूर्ण भी। जानकारी का यह अभाव अब दूर होना आवश्यक है।

बहुत से लोगों की धारणा है कि यूनिकोड हिंदी के लिए विकसित की गई तकनीक है। ऐसा नहीं है, यह एक वैश्विक परिघटना है, जो सिर्फ हिंदी भाषा या देवनागरी लिपि को केंद्र में नहीं रखती बल्कि विश्व की अधिकांश भाषाओं से संबंधित पाठ संबंधी समस्याओं का समाधान करने के लिए घटित हुई है। जिस तरह की समस्याएँ हिंदी में थीं, वैसी ही विश्व की अधिकांश गैर-अंग्रेजी भाषाओं में भी मौजूद थीं। इनकी वजह से वैश्विक स्तर पर कितने कार्य दिवस बरबाद होते होंगे और कितनी समग्र असुविधा व अव्यवस्था होती होगी, इसका अनुमान लगाना मुश्किल नहीं है। यूनिकोड सभी भाषाओं की ऐसी समस्याओं का समाधान करने के लिए विकसित की गई टेक्स्ट एनकोडिंग प्रणाली है। वह सिर्फ हिंदी या देवनागरी के लिए नहीं है, बल्कि अन्य भारतीय भाषाओं के साथ-साथ थाई, हिब्रू, चीनी, अरबी और अन्य सभी वैश्विक भाषाओं की समस्याओं का समाधान करती है। इसका जन्म भी भारत में नहीं हुआ, बल्कि यूनिकोड कंशोर्शियम नामक अंतरराष्ट्रीय संगठन ने इसका विकास किया है, जिसका मुख्यालय अमेरिका में है और जिसके सदस्यों में अधिकांश बड़ी सूचना प्रौद्योगिकी कंपनियाँ और सरकारें शामिल हैं।

यूनिकोड पर एक बड़ी गलतफहमी यह है कि यह कोई फॉण्ट है। बहुत से लोग यह पूछताछ करते पाए जाते हैं कि यूनिकोड फॉण्ट कहाँ से मिलेगा? यूनिकोड कोई फॉण्ट नहीं बल्कि एक टेक्स्ट एनकोडिंग (टंकित पाठ को डिजिटल माध्यमों पर सहेजने के नियम) है। फॉण्ट तो ‘मंगल’ है, जो यूनिकोड के नियमों के आधार पर बनाया गया है। अन्य प्रचलित यूनिकोड फॉण्टों में एरियल यूनिकोड एमएस, अपराजिता, कोकिला और उत्साह प्रमुख हैं। संयोगवश मंगल, अपराजिता, कोकिला और उत्साह तो आपके विंडोज कंप्यूटर में पहले से इंस्टॉल किए हुए आते हैं। एरियल यूनिकोड एमएस फॉण्ट एमएस ऑफिस पैकेज के साथ इंस्टॉल होता है। अगर कंप्यूटर में विंडोज ७, ८ आदि मौजूद है और आप एमएस ऑफिस के अपेक्षाकृत नए संस्करण में काम करते हैं तो आपके पास हिंदी के पाँच यूनिकोड फॉण्ट तो पहले ही मौजूद हैं।

अनेक लोगों को लगता है कि यूनिकोड वह है, जो वे गूगल या माइक्रोसॉफ्ट की वेबसाइट से डाउनलोड करते हैं। वास्तव में वे इनपुट मैथ्ड एडीटर्स की बात कर रहे हैं, जैसे गूगल हिंदी इनपुट या माइक्रोसॉफ्ट हिंदी आई.एम.ई., जो कंप्यूटर पर रोमन पद्धति से टाइप करते हुए देवनागरी में टेक्स्ट इनपुट संभव बनाते हैं। ये आईएमई छोटे-छोटे टूल हैं, जो आपको टाइपिंग में मदद करते हैं। फॉण्ट तो वे वही इस्तेमाल करते हैं, जो कंप्यूटर में पहले से मौजूद है, यानी मंगल आदि।

हिंदी यूनिकोड को लेकर संघर्ष तभी शुरू हो जाता है, जब आप कंप्यूटर खरीदते हैं। कारण? कंप्यूटर में यूनिकोड सुविधा मौजूद होने और हिंदी के फॉण्ट भी पहले से मौजूद होने के बावजूद उसमें हिंदी यूनिकोड समर्थन पहले से सक्रिय होकर नहीं आता। आपको कंट्रोल पैनल में जाकर इसे सक्रिय करना होता है। यह बहुत छोटी सी दो-तीन मिनट की प्रक्रिया है, जिसके संपन्न होते ही कंप्यूटर में हिंदी यूनिकोड में काम करना संभव हो जाता है। लेकिन समस्या यह है कि इस बारे में लोगों को जानकारी ही नहीं है। वे बेचारे परेशान होते हैं कि हिंदी में काम करें तो कैसे, फॉण्ट कहाँ से डाउनलोड करें और हिंदी के सॉफ्टवेयर कहाँ से लाएँ। यूनिकोड चूँकि एक वैश्विक मानक है, इसलिए इसका प्रयोग करते हुए हिंदी में काम करने के लिए आपको किसी अतिरिक्त सॉफ्टवेयर की जरूरत नहीं है। जिन सॉफ्टवेयरों पर आप अंग्रेजी में काम कर पाते हैं, उन सभी में यूनिकोड की कृपा से हिंदी में भी काम कर पाएँगे। मसलन एमएस वर्ड, एक्सेल या पावरप्वॉइंट में।

यूनिकोड (मंगल) में टाइप करने के बाद अगर अपने पाठ को कृति देव में बदलना हो तो कनवर्टर क्यों इस्तेमाल करना होता है? क्योंकि कृति, चाणक्य, देव लिस, सुषा और डी.वी.टी.टी. योगेश जैसे फॉण्ट यूनिकोड समर्थित नहीं हैं। दोनों में पाठ को सहेजने के तरीके-अलग-अलग हैं और आपस में कोई सामंजस्य नहीं है। जब कृति, सुषा आदि फॉण्ट बने थे, तब यूनिकोड आया ही नहीं था, इसलिए उनका विकास करनेवालों को पता नहीं था कि भविष्य में कोई यूनिकोड नामक मानकीकृत प्रणाली भी आएगी, जिसके लिहाज से उन्हें अपने फॉण्टों को तैयार रखना चाहिए। तालमेल का यही अभाव यूनिकोड और गैर-यूनिकोड फॉण्टों के बीच टेक्स्ट को आपस में सही ढंग से परिवर्तित नहीं होने देता। आप पूछेंगे कि यह बात अंग्रेजी पर तो लागू नहीं होती? हाँ, क्योंकि अंग्रेजी को लेकर कभी कोई समस्या रही ही नहीं। अंग्रेजी का प्रयोग करते हुए कंप्यूटरों में पहले ही आसानी से काम करना संभव था। इसलिए अंग्रेजी के लिए अलग से यूनिकोड में व्यवस्था करने की जरूरत नहीं थी और उसके फॉण्ट समान नियमों पर आधारित हैं। यूनिकोड से पहले भी और यूनिकोड आने के बाद भी। उनके बीच तालमेल, जो पहले मौजूद था, वह आज भी बना हुआ है।

सोलह बिट एनकोडिंग

आइए, यूनिकोड को और गहराई से समझने की कोशिश करते हैं। सूचना प्रौद्योगिकी के क्षेत्र में विकास और सुधार की निरंतर प्रक्रिया चलती रहती है और इसी संदर्भ में पिछले कुछ वर्षों से सूचनाओं के भंडारण की एक आधुनिकतम पद्धति लोकप्रिय हो रही है, जिसे यूनिकोड कहते हैं। यूनिकोड के माध्यम से पहली बार सूचना प्रौद्योगिकी पर अंग्रेजी की अनिवार्य निर्भरता से मुक्ति की संभावनाएँ दिख रही हैं, क्योंकि यह पद्धति एक आम कंप्यूटर को विश्व की सभी भाषाओं में काम करने में सक्षम बना सकती है। जाहिर है, आई.टी. के क्षेत्र में भारतीय भाषाओं को विकसित होते देखने की आकांक्षा रखनेवाले लोग यूनिकोड में छिपी संभावनाओं को देखकर उत्साहित हैं, क्योंकि कई दशकों के बाद अब हम बिना अंग्रेजी जाने कंप्यूटर की क्षमताओं का प्रयोग करने की स्थिति में आ रहे हैं।

हालाँकि यूनिकोड है तो सिर्फ डेटा के स्टोरेज संबंधी एनकोडिंग मानक, लेकिन इसके प्रयोग से कंप्यूटरों की कार्यप्रणाली और उनके इस्तेमाल के तौर-तरीकों में क्रांतिकारी बदलाव आ सकता है, क्योंकि डेटा ही कंप्यूटरों के संचालन का केंद्रबिंदु है। भले ही हम कंप्यूटर का किसी भी काम के लिए प्रयोग करें, मसलन लेखन कार्य के लिए, ध्वनि रिकॉर्डिंग के लिए या फिर वीडियो प्रोसेसिंग के लिए, हमें इसके लिए कंप्यूटर को या तो कुछ सूचनाएँ प्रदान करनी पड़ती हैं (जैसे टाइपिंग के माध्यम से या रिकॉर्डिंग के जरिए) या फिर हम कुछ सूचनाएँ कंप्यूटर से ग्रहण करते हैं (मसलन पहले से रिकॉर्डेड वीडियो को देखना या पहले से मौजूद फाइलों को खोलना)। इन्हें क्रमशः इनपुट और आउटपुट के रूप में जाना जाता है। इन दोनों प्रक्रियाओं में जिन सूचनाओं (डेटा) का प्रयोग होता है, उसे कंप्यूटर पर अंकों के रूप में स्टोर किया जाता है, क्योंकि वह सिर्फ अंकों की भाषा जानता है और वह भी सिर्फ दो अंकों—‘शून्य’ तथा ‘एक’ की भाषा। इन दो अंकों का भिन्न-भिन्न ढंग से पारस्परिक बाइनरी संयोजन कर अलग-अलग डेटा को कंप्यूटर पर रखा जा सकता है। मिसाल के तौर पर ०१०००००१ का अर्थ है, अंग्रेजी का कैपिटल ‘ए’ अक्षर और ००११०००१ से तात्पर्य है ‘१’ का अंक।

अक्षरों या पाठ्य-सामग्री और कंप्यूटर पर स्टोर किए जानेवाले बाइनरी डिजिट्स के बीच तालमेल बिठानेवाली प्रणाली को एनकोडिंग कहते हैं। एनकोडिंग टेबल के माध्यम से कंप्यूटर यह तय करता है कि फलाँ बाइनरी कोड को फलाँ अक्षर या अंक के रूप में स्क्रीन पर प्रदर्शित किया जाए। किस एनकोडिंग में कितने बाइनरी अंक प्रयुक्त होते हैं, इसी पर उसकी क्षमता और नामकरण निर्भर होते हैं। उदाहरण के तौर पर अब तक लोकप्रिय एस्की एनकोडिंग को ७ बिट एनकोडिंग कहा जाता है, क्योंकि इसमें हर संकेत या सूचना के भंडारण के लिए ऐसे सात बाइनरी डिजिट्स का प्रयोग होता है। एस्की एनकोडिंग के तहत इस तरह के १२८ अलग-अलग संयोजन संभव हैं, यानी इस एनकोडिंग का प्रयोग करनेवाला कंप्यूटर १२८ अलग-अलग अक्षरों या संकेतों को समझ सकता है। अब तक कंप्यूटर इसी सीमा में बँधे हुए थे और इसीलिए भाषाओं के प्रयोग के लिए उन भाषाओं के फॉण्ट पर सीमित थे, जो इन संकेतों को कंप्यूटर स्क्रीन पर अलग-अलग ढंग से प्रदर्शित करते हैं। यदि अंग्रेजी का फॉण्ट इस्तेमाल करें तो ०१०००००१ संकेत को ए अक्षर के रूप में दिखाया जाएगा। लेकिन यदि हिंदी फॉण्ट का प्रयोग करें तो यही संकेत ‘ग’, ‘च’ या किसी और अक्षर के रूप में प्रदर्शित किया जाएगा।

यूनिकोड एक १६ बिट की एनकोडिंग व्यवस्था है, यानी इसमें हर संकेत को संग्रह और अभिव्यक्त करने के लिए सोलह बाइनरी डिजिट्स का इस्तेमाल होता है। इसीलिए इसमें एक लाख से अधिक अद्वितीय संयोजन संभव हैं। इसी वजह से यूनिकोड हमारे कंप्यूटर में सहेजे गए डेटा को फॉण्ट की सीमाओं से बाहर निकाल देता है। इस एनकोडिंग में किसी भी अक्षर, अंक या संकेत को सोलह अंकों के अद्वितीय संयोजन के रूप में सहेजकर रखा जा सकता है। चूँकि किसी एक भाषा में इतने सारे अद्वितीय अक्षर मौजूद नहीं हैं, इसलिए इस स्टैंडर्ड (मानक) में विश्व की लगभग सारी भाषाओं को शामिल कर लिया गया है। हर भाषा को इन हजारों संयोजनों में से उसकी वर्णमाला संबंधी आवश्यकताओं के अनुसार स्थान दिया गया है। इस व्यवस्था में सभी भाषाएँ समान दर्जा रखती हैं और सहजीवी हैं। यानी यूनिकोड आधारित कंप्यूटर पहले से ही विश्व की हर भाषा से परिचित है (बशर्ते ऑपरेटिंग सिस्टम में इसकी क्षमता हो)। भले ही वह हिंदी हो या पंजाबी या फिर उड़िया। इतना ही नहीं, वह उन प्राचीन भाषाओं से भी परिचित है, जो अब बोलचाल में इस्तेमाल नहीं होतीं, जैसे कि पाली या प्राकृत, और उन भाषाओं से भी, जो संकेतों के रूप में प्रयुक्त होती हैं, जैसे कि गणितीय या वैज्ञानिकसंकेत।

यूनिकोड के प्रयोग से सबसे बड़ा लाभ यह हुआ है कि एक कंप्यूटर पर दर्ज किया गया पाठ (टेक्स्ट) विश्व के किसी भी अन्य यूनिकोड आधारित कंप्यूटर पर खोला जा सकता है। इसके लिए अलग से उस भाषा के फॉण्ट का इस्तेमाल करने की अनिवार्यता नहीं है, क्योंकि यूनिकोड केंद्रित हर फॉण्ट में सिद्धांततः विश्व की हर भाषा के अक्षर मौजूद हैं। कंप्यूटर में पहले से मौजूद इस क्षमता को सिर्फ एक्टिवेट (सक्रिय) करने की जरूरत है, जो विंडोज, मैकिन्टोश, लिनक्स आदि ऑपरेटिंग सिस्टम्स के जरिए की जाती है। यही बात मोबाइल ऑपरेटिंग सिस्टमों (एंड्रोइड, आइ.ओ.एस. और विंडोज) पर लागू होती है।

विश्व भाषाओं की यह उपलब्धता सिर्फ देखने या पढ़ने तक ही सीमित नहीं है। हिंदी जाननेवाला व्यक्ति यूनिकोड आधारित किसी भी कंप्यूटर में टाइप कर सकता है, भले ही वह विश्व के किसी भी कोने में क्यों न हो। सिर्फ हिंदी ही क्यों, एक ही फाइल में, एक ही फॉण्ट का इस्तेमाल करते हुए आप विश्व की किसी भी भाषा में लिख सकते हैं। इस प्रक्रिया में अंग्रेजी कहीं भी आड़े नहीं आती। विश्व भर में चल रही भूमंडलीकरण की प्रक्रिया में सूचना प्रौद्योगिकी का यह अपना अलग ढंग का योगदान है।

यूनिकोड आधारित कंप्यूटरों में हर काम किसी भी भारतीय भाषा में किया जा सकता है, बशर्ते ऑपरेटिंग सिस्टम या कंप्यूटर पर इंस्टॉल किए गए सॉफ्टवेयर यूनिकोड व्यवस्था का पालन करें। उदाहरण के लिए माइक्रोसॉफ्ट के ऑफिस संस्करण ओपनऑफिस.ऑर्ग जैसे सॉफ्टवेयरों में आप शब्द संसाधक (वर्ड प्रोसेसर), तालिका आधारित सॉफ्टवेयर (स्प्रैडशीट), प्रस्तुति संबंधी सॉफ्टवेयर (पावर-प्वॉइंट आदि) तक में हिंदी और अन्य भाषाओं का बिल्कुल उसी तरह प्रयोग कर सकते हैं जैसे कि अंग्रेजी में। यानी न सिर्फ टाइपिंग बल्कि शॉर्टिंग, इंडेक्सिंग, सर्च, मेल मर्ज, हेडर-फुटर, फुटनोट्स, टिप्पणियाँ (कमेंट) आदि सबकुछ। कंप्यूटर पर फाइलों के नाम लिखने के लिए भी अब अंग्रेजी की जरूरत नहीं रह गई है। यदि आप अपनी फाइल का नाम हिंदी में ‘मेरीफाइल’ भी रखना चाहें तो इसमें कोई अड़चन नहीं है। इंटरनेट पर भी अब हिंदी का ९५ फीसदी काम यूनिकोड पर आधारित है।

कंप्यूटर अब अंग्रेजी का मोहताज नहीं रहा और इसीलिए यूनिकोड ने उसकी संपूर्ण कार्यप्रणाली भी बदल दी है। डेटा के भंडारण के साथ-साथ उसकी प्रोसेसिंग और प्रस्तुति के तरीके भी बदल गए हैं। चूँकि यूनिकोड सोलह बिट की एनकोडिंग व्यवस्था है और विश्व के अधिकांश सॉफ्टवेयर पुरानी एनकोडिंग व्यवस्था को ध्यान में रखते हुए विकसित किए गए थे, इसलिए ऐसे (पुराने) सॉफ्टवेयर यूनिकोड टेक्स्ट को समझ नहीं पाते। नतीजतन विश्व भर में सॉफ्टवेयरों को यूनिकोड समर्थन युक्त बनाने की प्रक्रिया चल रही है। पेजमेकिंग और ग्राफिक्स सॉफ्टवेयरों में यह गति धीमी रही, लेकिन अब उनमें से अधिकांश में यूनिकोड हिंदी में काम करना संभव है। लेकिन आम इस्तेमाल के दफ्तरी सॉफ्टवेयरों (एम.एस. ऑफिस सहित) में यूनिकोड का शानदार समर्थन उपलब्धहै।

हिंदी में पिछले एक दशक के आसपास की अवधि में सूचना प्रौद्योगिकी क्षेत्र में हुई ज्यादातर तरक्की शायद नहीं हो पाती, अगर यूनिकोड नाम की सौगात हमारी भाषा को न मिली होती। यूनिकोड ने देवनागरी लिपि में पाठ इनपुट करने, सहेजने, डिजिटल माध्यमों से एक से दूसरी जगह भेजने, सूचनाओं का प्रसंस्करण करने, आउटपुट प्रदान करने जैसी प्रक्रियाओं के प्रत्यक्ष-अप्रत्यक्ष मानकीकरण में योगदान दिया है। भले ही हिंदी टंकण को लेकर आज भी संशय बरकरार है और लोग इनस्क्रिप्ट, ट्रांसलिटरेशन तथा रेमिंगटन के तौर-तरीकों का इस्तेमाल करते हुए देवनागरी में कंप्यूटर पर टंकण कर रहे हैं, लेकिन कम-से-कम टेक्स्ट इनपुट किए जाने के बाद की स्थिति काफी हद तक मानकीकरण के सिद्धांतों का पालन करती है।

इसका तात्पर्य यह हुआ कि भले ही आप अपने देवनागरी टेक्स्ट को रोमन की-बोर्ड का इस्तेमाल करते हुए ट्रांसलिटरेशन के जरिए देवनागरी में बदलकर टाइप करें या फिर सीधे इनस्क्रिप्ट/रेमिंगटन कीबोर्ड के माध्यम से कंप्यूटर/डिजिटल प्रणालियों में इनपुट करें, एक बार टाइप होने के बाद आपकी लिखी इबारत मानकीकृत यूनिकोड टेक्स्ट के रूप में सहेजी जाती है। एक बार टाइप होने और भंडारित किए जाने के बाद यह पाठ मानकीकृत हो जाता है। उसके बाद इसे विंडोज में इस्तेमाल करें या फिर मैकिनटोश कंप्यूटरों पर खोलें, टैबलेट में पढ़ें या फिर स्मार्टफोन पर प्रयुक्त करें (संबंधित गैजेट या ऑपरेटिंग सिस्टम में मौजूद हिंदी यूनिकोड फॉण्ट के अनुरूप), वह प्रायः समान दिखाई देता है। यह यूनिकोड की शक्ति है, जिसने हिंदी और देवनागरी को समृद्ध किया है और उन्हें उस तकनीकी विचलन से मुक्त किया है, जिसकी वजह से इस भाषा और लिपि में कार्य करनेवाले लोग अलग-अलग पद्धतियों से टंकण करने, अलग-अलग फॉण्टों का प्रयोग करने और अलग-अलग सॉफ्टवेयरों पर निर्भर होने के लिए मजबूर थे। विभिन्न ऑपरेटिंग सिस्टमों (विंडोज, मैक और लिनक्स आदि) की तो बात ही छोड़िए, एक ही कंप्यूटर पर अलग-अलग हिंदी सॉफ्टवेयरों का प्रयोग करते हुए देवनागरी में टंकित की गई सामग्री दूसरे सॉफ्टवेयर के लिए जंक या गारबेज (पढ़ी या समझी न जा सकनेवाली उल्टी-पुल्टी इबारत) मात्र बन जाती थी। वह भी छोड़िए, एक हिंदी फॉण्ट में टंकित सामग्री दूसरे हिंदी फॉण्ट का प्रयोग करने पर अर्थहीन हो जाती थी।

सो यूनिकोड ने हिंदी और देवनागरी का बहुत भला किया है। यों यूनिकोड के आगमन को लगभग ढाई दशक बीत चुके हैं। माइक्रोसॉफ्ट एक्सपी और विंडोज २००० में हिंदी में यूनिकोड में कामकाज की शुरुआत हो गई थी। जाहिर है, हिंदी में यूनिकोड का विधिवत् प्रयोग करते हुए भी हमें डेढ़ दशक की अवधि बीत चुकी है। लेकिन सामान्य हिंदी कंप्यूटर प्रयोक्ताओं के बीच आज भी उसके बारे में जागरूकता का अभाव है। यह आश्चर्यजनक भी है और खेदपूर्ण भी। जानकारी का यह अभाव अब दूर होना आवश्यक है।

बहुत से लोगों की धारणा है कि यूनिकोड हिंदी के लिए विकसित की गई तकनीक है। ऐसा नहीं है, यह एक वैश्विक परिघटना है, जो सिर्फ हिंदी भाषा या देवनागरी लिपि को केंद्र में नहीं रखती बल्कि विश्व की अधिकांश भाषाओं से संबंधित पाठ संबंधी समस्याओं का समाधान करने के लिए घटित हुई है। जिस तरह की समस्याएँ हिंदी में थीं, वैसी ही विश्व की अधिकांश गैर-अंग्रेजी भाषाओं में भी मौजूद थीं। इनकी वजह से वैश्विक स्तर पर कितने कार्य दिवस बरबाद होते होंगे और कितनी समग्र असुविधा व अव्यवस्था होती होगी, इसका अनुमान लगाना मुश्किल नहीं है। यूनिकोड सभी भाषाओं की ऐसी समस्याओं का समाधान करने के लिए विकसित की गई टेक्स्ट एनकोडिंग प्रणाली है। वह सिर्फ हिंदी या देवनागरी के लिए नहीं है, बल्कि अन्य भारतीय भाषाओं के साथ-साथ थाई, हिब्रू, चीनी, अरबी और अन्य सभी वैश्विक भाषाओं की समस्याओं का समाधान करती है। इसका जन्म भी भारत में नहीं हुआ, बल्कि यूनिकोड कंशोर्शियम नामक अंतरराष्ट्रीय संगठन ने इसका विकास किया है, जिसका मुख्यालय अमेरिका में है और जिसके सदस्यों में अधिकांश बड़ी सूचना प्रौद्योगिकी कंपनियाँ और सरकारें शामिल हैं।

यूनिकोड पर एक बड़ी गलतफहमी यह है कि यह कोई फॉण्ट है। बहुत से लोग यह पूछताछ करते पाए जाते हैं कि यूनिकोड फॉण्ट कहाँ से मिलेगा? यूनिकोड कोई फॉण्ट नहीं बल्कि एक टेक्स्ट एनकोडिंग (टंकित पाठ को डिजिटल माध्यमों पर सहेजने के नियम) है। फॉण्ट तो ‘मंगल’ है, जो यूनिकोड के नियमों के आधार पर बनाया गया है। अन्य प्रचलित यूनिकोड फॉण्टों में एरियल यूनिकोड एमएस, अपराजिता, कोकिला और उत्साह प्रमुख हैं। संयोगवश मंगल, अपराजिता, कोकिला और उत्साह तो आपके विंडोज कंप्यूटर में पहले से इंस्टॉल किए हुए आते हैं। एरियल यूनिकोड एमएस फॉण्ट एमएस ऑफिस पैकेज के साथ इंस्टॉल होता है। अगर कंप्यूटर में विंडोज ७, ८ आदि मौजूद है और आप एमएस ऑफिस के अपेक्षाकृत नए संस्करण में काम करते हैं तो आपके पास हिंदी के पाँच यूनिकोड फॉण्ट तो पहले ही मौजूद हैं।

अनेक लोगों को लगता है कि यूनिकोड वह है, जो वे गूगल या माइक्रोसॉफ्ट की वेबसाइट से डाउनलोड करते हैं। वास्तव में वे इनपुट मैथ्ड एडीटर्स की बात कर रहे हैं, जैसे गूगल हिंदी इनपुट या माइक्रोसॉफ्ट हिंदी आई.एम.ई., जो कंप्यूटर पर रोमन पद्धति से टाइप करते हुए देवनागरी में टेक्स्ट इनपुट संभव बनाते हैं। ये आईएमई छोटे-छोटे टूल हैं, जो आपको टाइपिंग में मदद करते हैं। फॉण्ट तो वे वही इस्तेमाल करते हैं, जो कंप्यूटर में पहले से मौजूद है, यानी मंगल आदि।

हिंदी यूनिकोड को लेकर संघर्ष तभी शुरू हो जाता है, जब आप कंप्यूटर खरीदते हैं। कारण? कंप्यूटर में यूनिकोड सुविधा मौजूद होने और हिंदी के फॉण्ट भी पहले से मौजूद होने के बावजूद उसमें हिंदी यूनिकोड समर्थन पहले से सक्रिय होकर नहीं आता। आपको कंट्रोल पैनल में जाकर इसे सक्रिय करना होता है। यह बहुत छोटी सी दो-तीन मिनट की प्रक्रिया है, जिसके संपन्न होते ही कंप्यूटर में हिंदी यूनिकोड में काम करना संभव हो जाता है। लेकिन समस्या यह है कि इस बारे में लोगों को जानकारी ही नहीं है। वे बेचारे परेशान होते हैं कि हिंदी में काम करें तो कैसे, फॉण्ट कहाँ से डाउनलोड करें और हिंदी के सॉफ्टवेयर कहाँ से लाएँ। यूनिकोड चूँकि एक वैश्विक मानक है, इसलिए इसका प्रयोग करते हुए हिंदी में काम करने के लिए आपको किसी अतिरिक्त सॉफ्टवेयर की जरूरत नहीं है। जिन सॉफ्टवेयरों पर आप अंग्रेजी में काम कर पाते हैं, उन सभी में यूनिकोड की कृपा से हिंदी में भी काम कर पाएँगे। मसलन एमएस वर्ड, एक्सेल या पावरप्वॉइंट में।

यूनिकोड (मंगल) में टाइप करने के बाद अगर अपने पाठ को कृति देव में बदलना हो तो कनवर्टर क्यों इस्तेमाल करना होता है? क्योंकि कृति, चाणक्य, देव लिस, सुषा और डी.वी.टी.टी. योगेश जैसे फॉण्ट यूनिकोड समर्थित नहीं हैं। दोनों में पाठ को सहेजने के तरीके-अलग-अलग हैं और आपस में कोई सामंजस्य नहीं है। जब कृति, सुषा आदि फॉण्ट बने थे, तब यूनिकोड आया ही नहीं था, इसलिए उनका विकास करनेवालों को पता नहीं था कि भविष्य में कोई यूनिकोड नामक मानकीकृत प्रणाली भी आएगी, जिसके लिहाज से उन्हें अपने फॉण्टों को तैयार रखना चाहिए। तालमेल का यही अभाव यूनिकोड और गैर-यूनिकोड फॉण्टों के बीच टेक्स्ट को आपस में सही ढंग से परिवर्तित नहीं होने देता। आप पूछेंगे कि यह बात अंग्रेजी पर तो लागू नहीं होती? हाँ, क्योंकि अंग्रेजी को लेकर कभी कोई समस्या रही ही नहीं। अंग्रेजी का प्रयोग करते हुए कंप्यूटरों में पहले ही आसानी से काम करना संभव था। इसलिए अंग्रेजी के लिए अलग से यूनिकोड में व्यवस्था करने की जरूरत नहीं थी और उसके फॉण्ट समान नियमों पर आधारित हैं। यूनिकोड से पहले भी और यूनिकोड आने के बाद भी। उनके बीच तालमेल, जो पहले मौजूद था, वह आज भी बना हुआ है।

सोलह बिट एनकोडिंग

आइए, यूनिकोड को और गहराई से समझने की कोशिश करते हैं। सूचना प्रौद्योगिकी के क्षेत्र में विकास और सुधार की निरंतर प्रक्रिया चलती रहती है और इसी संदर्भ में पिछले कुछ वर्षों से सूचनाओं के भंडारण की एक आधुनिकतम पद्धति लोकप्रिय हो रही है, जिसे यूनिकोड कहते हैं। यूनिकोड के माध्यम से पहली बार सूचना प्रौद्योगिकी पर अंग्रेजी की अनिवार्य निर्भरता से मुक्ति की संभावनाएँ दिख रही हैं, क्योंकि यह पद्धति एक आम कंप्यूटर को विश्व की सभी भाषाओं में काम करने में सक्षम बना सकती है। जाहिर है, आई.टी. के क्षेत्र में भारतीय भाषाओं को विकसित होते देखने की आकांक्षा रखनेवाले लोग यूनिकोड में छिपी संभावनाओं को देखकर उत्साहित हैं, क्योंकि कई दशकों के बाद अब हम बिना अंग्रेजी जाने कंप्यूटर की क्षमताओं का प्रयोग करने की स्थिति में आ रहे हैं।

हालाँकि यूनिकोड है तो सिर्फ डेटा के स्टोरेज संबंधी एनकोडिंग मानक, लेकिन इसके प्रयोग से कंप्यूटरों की कार्यप्रणाली और उनके इस्तेमाल के तौर-तरीकों में क्रांतिकारी बदलाव आ सकता है, क्योंकि डेटा ही कंप्यूटरों के संचालन का केंद्रबिंदु है। भले ही हम कंप्यूटर का किसी भी काम के लिए प्रयोग करें, मसलन लेखन कार्य के लिए, ध्वनि रिकॉर्डिंग के लिए या फिर वीडियो प्रोसेसिंग के लिए, हमें इसके लिए कंप्यूटर को या तो कुछ सूचनाएँ प्रदान करनी पड़ती हैं (जैसे टाइपिंग के माध्यम से या रिकॉर्डिंग के जरिए) या फिर हम कुछ सूचनाएँ कंप्यूटर से ग्रहण करते हैं (मसलन पहले से रिकॉर्डेड वीडियो को देखना या पहले से मौजूद फाइलों को खोलना)। इन्हें क्रमशः इनपुट और आउटपुट के रूप में जाना जाता है। इन दोनों प्रक्रियाओं में जिन सूचनाओं (डेटा) का प्रयोग होता है, उसे कंप्यूटर पर अंकों के रूप में स्टोर किया जाता है, क्योंकि वह सिर्फ अंकों की भाषा जानता है और वह भी सिर्फ दो अंकों—‘शून्य’ तथा ‘एक’ की भाषा। इन दो अंकों का भिन्न-भिन्न ढंग से पारस्परिक बाइनरी संयोजन कर अलग-अलग डेटा को कंप्यूटर पर रखा जा सकता है। मिसाल के तौर पर ०१०००००१ का अर्थ है, अंग्रेजी का कैपिटल ‘ए’ अक्षर और ००११०००१ से तात्पर्य है ‘१’ का अंक।

अक्षरों या पाठ्य-सामग्री और कंप्यूटर पर स्टोर किए जानेवाले बाइनरी डिजिट्स के बीच तालमेल बिठानेवाली प्रणाली को एनकोडिंग कहते हैं। एनकोडिंग टेबल के माध्यम से कंप्यूटर यह तय करता है कि फलाँ बाइनरी कोड को फलाँ अक्षर या अंक के रूप में स्क्रीन पर प्रदर्शित किया जाए। किस एनकोडिंग में कितने बाइनरी अंक प्रयुक्त होते हैं, इसी पर उसकी क्षमता और नामकरण निर्भर होते हैं। उदाहरण के तौर पर अब तक लोकप्रिय एस्की एनकोडिंग को ७ बिट एनकोडिंग कहा जाता है, क्योंकि इसमें हर संकेत या सूचना के भंडारण के लिए ऐसे सात बाइनरी डिजिट्स का प्रयोग होता है। एस्की एनकोडिंग के तहत इस तरह के १२८ अलग-अलग संयोजन संभव हैं, यानी इस एनकोडिंग का प्रयोग करनेवाला कंप्यूटर १२८ अलग-अलग अक्षरों या संकेतों को समझ सकता है। अब तक कंप्यूटर इसी सीमा में बँधे हुए थे और इसीलिए भाषाओं के प्रयोग के लिए उन भाषाओं के फॉण्ट पर सीमित थे, जो इन संकेतों को कंप्यूटर स्क्रीन पर अलग-अलग ढंग से प्रदर्शित करते हैं। यदि अंग्रेजी का फॉण्ट इस्तेमाल करें तो ०१०००००१ संकेत को ए अक्षर के रूप में दिखाया जाएगा। लेकिन यदि हिंदी फॉण्ट का प्रयोग करें तो यही संकेत ‘ग’, ‘च’ या किसी और अक्षर के रूप में प्रदर्शित किया जाएगा।

यूनिकोड एक १६ बिट की एनकोडिंग व्यवस्था है, यानी इसमें हर संकेत को संग्रह और अभिव्यक्त करने के लिए सोलह बाइनरी डिजिट्स का इस्तेमाल होता है। इसीलिए इसमें एक लाख से अधिक अद्वितीय संयोजन संभव हैं। इसी वजह से यूनिकोड हमारे कंप्यूटर में सहेजे गए डेटा को फॉण्ट की सीमाओं से बाहर निकाल देता है। इस एनकोडिंग में किसी भी अक्षर, अंक या संकेत को सोलह अंकों के अद्वितीय संयोजन के रूप में सहेजकर रखा जा सकता है। चूँकि किसी एक भाषा में इतने सारे अद्वितीय अक्षर मौजूद नहीं हैं, इसलिए इस स्टैंडर्ड (मानक) में विश्व की लगभग सारी भाषाओं को शामिल कर लिया गया है। हर भाषा को इन हजारों संयोजनों में से उसकी वर्णमाला संबंधी आवश्यकताओं के अनुसार स्थान दिया गया है। इस व्यवस्था में सभी भाषाएँ समान दर्जा रखती हैं और सहजीवी हैं। यानी यूनिकोड आधारित कंप्यूटर पहले से ही विश्व की हर भाषा से परिचित है (बशर्ते ऑपरेटिंग सिस्टम में इसकी क्षमता हो)। भले ही वह हिंदी हो या पंजाबी या फिर उड़िया। इतना ही नहीं, वह उन प्राचीन भाषाओं से भी परिचित है, जो अब बोलचाल में इस्तेमाल नहीं होतीं, जैसे कि पाली या प्राकृत, और उन भाषाओं से भी, जो संकेतों के रूप में प्रयुक्त होती हैं, जैसे कि गणितीय या वैज्ञानिकसंकेत।

यूनिकोड के प्रयोग से सबसे बड़ा लाभ यह हुआ है कि एक कंप्यूटर पर दर्ज किया गया पाठ (टेक्स्ट) विश्व के किसी भी अन्य यूनिकोड आधारित कंप्यूटर पर खोला जा सकता है। इसके लिए अलग से उस भाषा के फॉण्ट का इस्तेमाल करने की अनिवार्यता नहीं है, क्योंकि यूनिकोड केंद्रित हर फॉण्ट में सिद्धांततः विश्व की हर भाषा के अक्षर मौजूद हैं। कंप्यूटर में पहले से मौजूद इस क्षमता को सिर्फ एक्टिवेट (सक्रिय) करने की जरूरत है, जो विंडोज, मैकिन्टोश, लिनक्स आदि ऑपरेटिंग सिस्टम्स के जरिए की जाती है। यही बात मोबाइल ऑपरेटिंग सिस्टमों (एंड्रोइड, आइ.ओ.एस. और विंडोज) पर लागू होती है।

विश्व भाषाओं की यह उपलब्धता सिर्फ देखने या पढ़ने तक ही सीमित नहीं है। हिंदी जाननेवाला व्यक्ति यूनिकोड आधारित किसी भी कंप्यूटर में टाइप कर सकता है, भले ही वह विश्व के किसी भी कोने में क्यों न हो। सिर्फ हिंदी ही क्यों, एक ही फाइल में, एक ही फॉण्ट का इस्तेमाल करते हुए आप विश्व की किसी भी भाषा में लिख सकते हैं। इस प्रक्रिया में अंग्रेजी कहीं भी आड़े नहीं आती। विश्व भर में चल रही भूमंडलीकरण की प्रक्रिया में सूचना प्रौद्योगिकी का यह अपना अलग ढंग का योगदान है।

यूनिकोड आधारित कंप्यूटरों में हर काम किसी भी भारतीय भाषा में किया जा सकता है, बशर्ते ऑपरेटिंग सिस्टम या कंप्यूटर पर इंस्टॉल किए गए सॉफ्टवेयर यूनिकोड व्यवस्था का पालन करें। उदाहरण के लिए माइक्रोसॉफ्ट के ऑफिस संस्करण ओपनऑफिस.ऑर्ग जैसे सॉफ्टवेयरों में आप शब्द संसाधक (वर्ड प्रोसेसर), तालिका आधारित सॉफ्टवेयर (स्प्रैडशीट), प्रस्तुति संबंधी सॉफ्टवेयर (पावर-प्वॉइंट आदि) तक में हिंदी और अन्य भाषाओं का बिल्कुल उसी तरह प्रयोग कर सकते हैं जैसे कि अंग्रेजी में। यानी न सिर्फ टाइपिंग बल्कि शॉर्टिंग, इंडेक्सिंग, सर्च, मेल मर्ज, हेडर-फुटर, फुटनोट्स, टिप्पणियाँ (कमेंट) आदि सबकुछ। कंप्यूटर पर फाइलों के नाम लिखने के लिए भी अब अंग्रेजी की जरूरत नहीं रह गई है। यदि आप अपनी फाइल का नाम हिंदी में ‘मेरीफाइल’ भी रखना चाहें तो इसमें कोई अड़चन नहीं है। इंटरनेट पर भी अब हिंदी का ९५ फीसदी काम यूनिकोड पर आधारित है।

कंप्यूटर अब अंग्रेजी का मोहताज नहीं रहा और इसीलिए यूनिकोड ने उसकी संपूर्ण कार्यप्रणाली भी बदल दी है। डेटा के भंडारण के साथ-साथ उसकी प्रोसेसिंग और प्रस्तुति के तरीके भी बदल गए हैं। चूँकि यूनिकोड सोलह बिट की एनकोडिंग व्यवस्था है और विश्व के अधिकांश सॉफ्टवेयर पुरानी एनकोडिंग व्यवस्था को ध्यान में रखते हुए विकसित किए गए थे, इसलिए ऐसे (पुराने) सॉफ्टवेयर यूनिकोड टेक्स्ट को समझ नहीं पाते। नतीजतन विश्व भर में सॉफ्टवेयरों को यूनिकोड समर्थन युक्त बनाने की प्रक्रिया चल रही है। पेजमेकिंग और ग्राफिक्स सॉफ्टवेयरों में यह गति धीमी रही, लेकिन अब उनमें से अधिकांश में यूनिकोड हिंदी में काम करना संभव है। लेकिन आम इस्तेमाल के दफ्तरी सॉफ्टवेयरों (एम.एस. ऑफिस सहित) में यूनिकोड का शानदार समर्थन उपलब्ध है।

— बालेंदु शर्मा दाधीच
५०४, पार्क रॉयल, जी एच-८०,
सेक्टर-५६, गुड़गाँव-१२२०११

हमारे संकलन