मंगलवार, 10 अप्रैल 2018

हिन्दी, आर्टिफिशियल इंटेलीजेंस और चमत्कार...खुशदीप




क्या ऐसा हो सकता है कि दुनिया की किसी भी भाषा की किताब या अखबार आपके सामने हो और आप उसे हिन्दी में फर्राटे के साथ पढ़ सकें?

क्या ऐसा हो सकता है कि आप दिल्ली में बैठकर फोन पर पेरिस में बैठे किसी ऐसे व्यक्ति से हिन्दी में बात करें जिसे हिन्दी बिल्कुल नहीं आती हो. आपको भी फ्रेंच का एक अक्षर नहीं आता हो. फिर भी दोनों एक दूसरे की पूरी बात को अच्छी तरह सुन सकें, समझ सकें?

क्या ऐसा हो सकता है टीचर क्लास में अंग्रेज़ी में बोले और बच्चे को साथ ही साथ सब कुछ अपनी भाषा में समझ आता चला जाए?

क्या ऐसा हो सकता है आप खास चश्मा पहन कर न्यूयॉर्क या लंदन घूमने जाएं और वहां आपको सब साइनबोर्ड, प्रिंटेड सामग्री सब कुछ हिन्दी में ही दिखाई दे?

क्या ऐसा हो सकता है कि आप अपने लैपटॉप या कंप्यूटर के पास आए और वो आपकी उम्र, लिंग के साथ-साथ आपका मूड कैसा है, ये सब भी बता दे.

क्या ऐसा हो सकता है कि खास चश्मे से किसी व्यक्ति को देखें और आपको उसका नाम, उम्र, पिता का नाम, पता सब कुछ साइड में पढ़ने को मिल जाएं.

आपको ये सारे सवाल कल्पना की उड़ान लग रहे होंगे?  लेकिन ये अब सब मुमकिन होने जा रहा है. माइक्रोसॉफ्ट में निदेशक, स्थानीयकरण (Director, Localisation)  बालेन्दु शर्मा दाधीच से हिन्दी और इसके इंटरनेट  से मेल (adaptation)  पर अक्सर अपनी जिज्ञासाओं का निवारण करता रहता हूं. बालेन्दु भाई राजभाषा तकनीक के विकास के साथ साथ हिन्दी को इंटरनेट पर प्रसारित-प्रचारित करने के लिए चुपचाप जो योगदान दे रहे हैं वो बहुत ही महत्वपूर्ण है. सभी हिन्दीभाषियों और भारत की अन्य भाषाएं बोलने वालों के जीवन पर इसका सकारात्मक असर पड़ेगा.

मान लीजिए कि कोई हिन्दी अंचल का छात्र बहुत मेधावी है लेकिन अंग्रेज़ी अच्छी ना जान पाने की वजह से उसका यूपीएससी या अन्य बड़ी प्रतियोगी परीक्षाओं में चयन नहीं हो पाता. लेकिन अब तकनीक ऐसे छात्रों के जीवन में क्रांतिकारी भूमिका निभाने जा रही है. यानि ज्ञान की परीक्षा के लिए किसी दूसरी भाषा को जानने की बाध्यता निकट भविष्य में समाप्त होने जा रही है.

मैं भारत में अक्सर ये सवाल भी सुनता रहता हूं कि क्या हिन्दी भी संस्कृत की तरह विलुप्त होने की दिशा में बढ़ रही है?  आख़िर क्यों होती है किसी भाषा या ज़ुबान को लेकर ऐसी फ़िक्र? हिन्दीभाषी भारत समेत दुनिया में कहीं भी हैं उन्हें अपनी इस भाषा से बहुत प्रेम है. विदेश में रहने वाले हिन्दीभाषियों को ये चिंता है कि उनकी अगली पीढ़ी अंग्रेज़ी में इतनी रच बस गई है कि भविष्य में हिन्दी का नामलेवा भी कोई नहीं रहेगा.

ये तो रही विदेश की बात. आप अपने ही देश में देखिए कि ग़रीब से ग़रीब माता-पिता भी यही चाहते हैं कि उनकी संतान अंग्रेज़ी मीडियम स्कूल में पढ़े. इसके पीछे कहीं ना कहीं यही सोच है कि बच्चों के सुनहरे करियर के लिए उन्हें अच्छी अंग्रेज़ी आना बहुत ज़रूरी है. अगर वो सिर्फ़ हिन्दी या अन्य भारतीय भाषाएं ही जानेंगे तो वे ऊंचे पदों तक नहीं पहुंच सकते.

अंग्रेज़ी को लेकर इतना क्रेज़ इसलिए भी ज़्यादा है क्योंकि इसे विश्व भर में संपर्क की भाषा माना जाता है. ये फ़िक्र भी रहती है कि संतान को बड़े होकर विदेश जाने का मौका मिलता है तो अच्छी अग्रेंजी जाने बिना वो कैसे दुनिया के दूसरे लोगों से संवाद (बातचीत) कर पाएगी? 

ऐसे ही सब सवालों के बीच मैं आपसे कहूं कि निकट भविष्य में ऐसी फ़िक्र करने की आपको कोई ज़रूरत नहीं रहेगी तो आपको अजीब लगेगा. जी हां, अब ना तो किसी भाषा के मृत होने का ख़तरा रहेगा और ना ही आपके लिए अंग्रेज़ी जैसी दूसरी भाषा को जानना मजबूरी रहेगा?  हां, आप शौक के लिए इसे सीखना चाहते हैं तो बात दूसरी है लेकिन ये आपके लिए अब अनिवार्यता नहीं रहेगा.

कैसे...आख़िर कैसे होगा ये सब?  इसका सीधा जवाब है तकनीक या टेक्नोलॉजी. आने वाले 50 वर्षों में तकनीक आपको ऐसी स्थिति में ले आएगी कि आपको अपनी भाषा के अलावा और किसी भाषा को सीखने की ज़रूरत नहीं रहेगी.

अपनी भाषा के हक में हम जब बात करते हैं, उसके अस्तित्व पर ख़तरा जताते हैं तो ये भूल जाते हैं कि तकनीक किस तरह चुपचाप दुनिया की तमाम भाषाओं के संरक्षण में लगी हुई है. बालेन्दु भाई के मुताबिक भारतीय भाषाओं के संरक्षण के लिए तीन चीज़ें बहुत अहम हैं और जिनका आज दुनिया में बहुत ज़ोर है और वो हैं-
1.     आर्टिफिशियल इंटेलीजेंस (AI)
2.     क्लाउड टेक्नोलॉजी
3.     बिग डेटा एनालिसिस  

आर्टिफिशियल इंटेलीजेंस और बिग डेटा एनालिसिस के बारे में आपने सुना होगा. वहीं क्लाउड टेक्नोलॉजी का इस्तेमाल इंटरनेट पर रखी हुई गई सामग्री के लिए होता है.

महान विचारक आर्थर सी क्लार्क के मुताबिक अगर कोई तकनीक समुचित रूप से विकसित हो जाती है तो वो किसी जादू या चमत्कार के समान ही होती है.

आर्टिफिशियल इंटेलीजेंस के साथ भी कुछ ऐसा ही है. इसी से संभव हो पाया है कि मशीन या कंप्यूटर में बोली हुई भाषा को समझने की क्षमता विकसित हो गई है. (जैसे कि अब मोबाइल पर आप बोलते हैं और वो खुद ही टाइप होता जाता है)

सीधी सी बात है कि कंप्यूटर आपके निर्देशों को समझने लगा है. WINDOWS में CORTANA नाम का एक सहायक आ गया है जिससे आप बात कर सकते हैं. किसी सवाल का जवाब जान सकते हैं जैसे कि आगरा में अभी कितना तापमान है और वो आपको जवाब देगा.

इसके मायने ये हैं कि कंप्यूटर से संवाद करने की दिशा में हम आगे बढ़ रहे हैं.

लिखी हुई पंक्तियों को बोलने की क्षमता के अलावा कंप्यूटर की देखने की क्षमता बहुत बढ़ गई है. वो अब लिखी हुई, छपी हुई, चित्रों के भीतर मौजूद शब्दों को समझने की क्षमता रखता है. माइक्रोसॉफ्ट ने ऐसी टेक्नोलॉजी बना ली है कि आपका कंप्यूटर बोलेगा तो आपकी आवाज़ में ही बोलेगा.

कंप्यूटर में आसपास की वस्तुओं और लोगों को पहचानने के साथ उनकी भावनाओं, उम्र, लिंग और हैंडराइटिंग तक को सही सही भांपने की क्षमता आ गई है. इसके लिए माइकोसॉफ्ट ने ही Video seeing AI नाम का ऐप विकसित किया है. जैसे कि एक महिला कंप्यूटर के पास आती है तो वो बता देगा कि 28 वर्षीय महिला चश्मा पहने हुए खुश दिखाई दे रही है.

जहां तक अनुवाद का सवाल है तो कंप्यूटर दुनिया की किसी भी भाषा का किसी दूसरी भाषा में अनुवाद करने लगा है. और ये वैसा मशीनी अनुवाद नहीं होता जैसा कि अभी तक आप मशीनी अनुवाद के दौरान कई हास्यास्पद स्थितियों को देखते रहे हैं...जैसे कि Around the clock को घड़ी के चारों ओर लिखा जाए.

आर्टिफिशियल इंटेलीजेंस के माध्यम से कंप्यूटर अपने आसपास के माहौल को समझने के बाद दूसरी भाषा में अनुवाद करेगा जिससे कि त्रुटियों की गुंजाइश ना के बराबर हो जाएगी और इनसान की तरह ही अनुवाद संभव हो सकेगा.

निष्कर्ष यही है कि तकनीक हमारी भाषाओं के लिए हौवा नहीं बल्कि उन्हें हमेशा हमेशा के लिए बचाने का काम कर सकती है. साथ ही ये दुनिया की सभी भाषाओं के बीच दूरियां खत्म करने के लिए सेतु का काम भी करेगी.

कितनी तेजी से ये काम हो रहा है इसका अंदाज इसी से लगाइए कि 2006 में गूगल ट्रांसलेटर और 2007 में माइक्रोसॉफ्ट ट्रांसलेटर शुरू हुआ और हम 10 साल में हम यहां तक पहुंच गए हैं. इसी से समझिए कि किस रफ्तार से तकनीक बढ़ रही है, भाषाओं के क्षेत्र में काम कर रही है. आर्टिफिशियल इंटेलीजेंस के लिए चार चीज़ें अहम हैं-

1.     ज्ञान यानि Knowledge- इसमें  80 फीसदी स्तर तक सफलता मिल चुकी है.
2.      दृष्टि यानि Vision-  96 फीसदी स्तर तक सफलता
3.      बोलना यानि Speech- 93 फीसदी स्तर तक सफलता
4.      भाषा यानि Language-  65 फीसदी स्तर तक सफलता

कंप्यूटर पर अनुवाद के दौरान जो त्रुटियां अभी दिखाई देती हैं वो इसी वजह से कि हम भाषा के क्षेत्र में 65 फीसदी स्तर तक ही पहुंचे हैं. जैसे जैसे ये स्तर बढ़ता जाएगा ये त्रुटियां कम होती जाएंगी. और जो ये लोग अभी कहते हैं कि कंप्यूटर कभी अनुवाद में इनसान की बराबरी नहीं कर सकता, उन्हें भी जवाब मिल जाएगा.

कंप्यूटर साइंस के जनक ऐलन टूरिंग का कहना है कि ये जरूरी नहीं कि इनसान किसी चीज़ के बारे में पहले से जानता हो, तभी उसे बना पाए. इससे ऐसे समझिए कि कंप्यूटर मशीन अंकगणित को जाने बिना ही बड़ी से बड़ी गणना बिना किसी त्रुटि कर सकता है. वो भी तब जब कि ये सिर्फ 0, 1 दो ही सिम्बल्स को पहचानता है.
इसी तरह कंप्यूटर किसी भाषा को जाने बिना दो भाषाओं के बीच परफेक्ट अनुवाद भी कर सकता है. इसके लिए वो सहारा लेता है Statistical Translation का जो  ग्रामर, भाषा ज्ञान पर आधारित नहीं बल्कि गणित पर आधारित होता है.

इसके लिए करोड़ों वाक्य एक भाषा में और करोड़ों अनुवाद दूसरी भाषा में तैयार किए जाते है. कंप्यूटर Parallel Corpus के आधार पर सीखता है कि आर्टिफिशियल इंटेलीजेंस का इस्तेमाल करते हुए अनुवाद कैसे होता है. हम अब क्लाउड की की दुनिया में हैं. जिस तरह से हम डेटा पैदा कर रहे हैं, हम अपने इंटरनेट, मेल, सर्च इंजन, अनुवाद में डेटा पैदा करते हैं वो सारा का सारा डेटा इंटरनेट पर इस्तेमाल किया जा सकता है यदि आपने उसकी अनुमति दी है.
इतने सारे डेटा का ही parallel corpus की तरह इस्तेमाल किया जाएगा तो कंप्यूटर बहुत तेजी से सीखने लगेगा. वही आर्टिफिशियल इंटेलीजेंस है. एक वक्त ऐसा भी आएगा कि कंप्यूटर अच्छे से अच्छे व्याकरणाचार्य से बेहतर अनुवाद करने लगेगा. आज नहीं तो कल वो करके दिखाएगा.

अब ये सब पढ़ने के बाद आप बताइए कि तकनीक भाषा के क्षेत्र में दुनिया के लोगों के बीच दूरियां घटाएगी या बढ़ाएगी?
बालेन्दु भाई अपनी बात पर केदारनाथ सिंह की इन पंक्तियों का सहारा लेते हुए विराम लगाते हैं-

मैं लौटता हूं तुम में, ओ मेरी भाषा
जैसे चीटिंयां लौटती हैं बिलों में,
जैसे कठफोड़वा लौटता है काठ पर,
जैसे विमान लौटते हैं सारे के सारे,
एक साथ डैने पसारे हुए
हवाई अड्डे की तरफ़,
उसी तरह मैं तुममें लौटता हूं मेरी भाषा,
जब चुप रहते रहते अकड़ जाती है मेरी जीभ,
और दुखने लगती है मेरी आत्मा...

इस वीडियो में बालेन्दु भाई को खुद ही सुनिए...





#हिन्दी_ब्लॉगिंग 







5 टिप्‍पणियां:

  1. आपकी इस प्रविष्टि् के लिंक की चर्चा कल बुधवार (11-04-2018) को ) "सिंह माँद में छिप गये" (चर्चा अंक-2937) पर होगी।
    --
    चर्चा मंच पर पूरी पोस्ट नहीं दी जाती है बल्कि आपकी पोस्ट का लिंक या लिंक के साथ पोस्ट का महत्वपूर्ण अंश दिया जाता है।
    जिससे कि पाठक उत्सुकता के साथ आपके ब्लॉग पर आपकी पूरी पोस्ट पढ़ने के लिए जाये।
    --
    हार्दिक शुभकामनाओं के साथ।
    सादर...!
    राधा तिवारी

    उत्तर देंहटाएं
  2. आपकी इस पोस्ट को आज की बुलेटिन घनश्याम दास बिड़ला और ब्लॉग बुलेटिन में शामिल किया गया है। कृपया एक बार आकर हमारा मान ज़रूर बढ़ाएं,,, सादर .... आभार।।

    उत्तर देंहटाएं
  3. कमाल की जानकारी ...बालेन्दु जी को साधुवाद ...और तुमको तो है ही इस जानकारी को हम तक लाने का ...

    उत्तर देंहटाएं