मंगलवार, 10 अप्रैल 2018

हिन्दी, आर्टिफिशियल इंटेलीजेंस और चमत्कार...खुशदीप




क्या ऐसा हो सकता है कि दुनिया की किसी भी भाषा की किताब या अखबार आपके सामने हो और आप उसे हिन्दी में फर्राटे के साथ पढ़ सकें?

क्या ऐसा हो सकता है कि आप दिल्ली में बैठकर फोन पर पेरिस में बैठे किसी ऐसे व्यक्ति से हिन्दी में बात करें जिसे हिन्दी बिल्कुल नहीं आती हो. आपको भी फ्रेंच का एक अक्षर नहीं आता हो. फिर भी दोनों एक दूसरे की पूरी बात को अच्छी तरह सुन सकें, समझ सकें?

क्या ऐसा हो सकता है टीचर क्लास में अंग्रेज़ी में बोले और बच्चे को साथ ही साथ सब कुछ अपनी भाषा में समझ आता चला जाए?

क्या ऐसा हो सकता है आप खास चश्मा पहन कर न्यूयॉर्क या लंदन घूमने जाएं और वहां आपको सब साइनबोर्ड, प्रिंटेड सामग्री सब कुछ हिन्दी में ही दिखाई दे?

क्या ऐसा हो सकता है कि आप अपने लैपटॉप या कंप्यूटर के पास आए और वो आपकी उम्र, लिंग के साथ-साथ आपका मूड कैसा है, ये सब भी बता दे.

क्या ऐसा हो सकता है कि खास चश्मे से किसी व्यक्ति को देखें और आपको उसका नाम, उम्र, पिता का नाम, पता सब कुछ साइड में पढ़ने को मिल जाएं.

आपको ये सारे सवाल कल्पना की उड़ान लग रहे होंगे?  लेकिन ये अब सब मुमकिन होने जा रहा है. माइक्रोसॉफ्ट में निदेशक, स्थानीयकरण (Director, Localisation)  बालेन्दु शर्मा दाधीच से हिन्दी और इसके इंटरनेट  से मेल (adaptation)  पर अक्सर अपनी जिज्ञासाओं का निवारण करता रहता हूं. बालेन्दु भाई राजभाषा तकनीक के विकास के साथ साथ हिन्दी को इंटरनेट पर प्रसारित-प्रचारित करने के लिए चुपचाप जो योगदान दे रहे हैं वो बहुत ही महत्वपूर्ण है. सभी हिन्दीभाषियों और भारत की अन्य भाषाएं बोलने वालों के जीवन पर इसका सकारात्मक असर पड़ेगा.

मान लीजिए कि कोई हिन्दी अंचल का छात्र बहुत मेधावी है लेकिन अंग्रेज़ी अच्छी ना जान पाने की वजह से उसका यूपीएससी या अन्य बड़ी प्रतियोगी परीक्षाओं में चयन नहीं हो पाता. लेकिन अब तकनीक ऐसे छात्रों के जीवन में क्रांतिकारी भूमिका निभाने जा रही है. यानि ज्ञान की परीक्षा के लिए किसी दूसरी भाषा को जानने की बाध्यता निकट भविष्य में समाप्त होने जा रही है.

मैं भारत में अक्सर ये सवाल भी सुनता रहता हूं कि क्या हिन्दी भी संस्कृत की तरह विलुप्त होने की दिशा में बढ़ रही है?  आख़िर क्यों होती है किसी भाषा या ज़ुबान को लेकर ऐसी फ़िक्र? हिन्दीभाषी भारत समेत दुनिया में कहीं भी हैं उन्हें अपनी इस भाषा से बहुत प्रेम है. विदेश में रहने वाले हिन्दीभाषियों को ये चिंता है कि उनकी अगली पीढ़ी अंग्रेज़ी में इतनी रच बस गई है कि भविष्य में हिन्दी का नामलेवा भी कोई नहीं रहेगा.

ये तो रही विदेश की बात. आप अपने ही देश में देखिए कि ग़रीब से ग़रीब माता-पिता भी यही चाहते हैं कि उनकी संतान अंग्रेज़ी मीडियम स्कूल में पढ़े. इसके पीछे कहीं ना कहीं यही सोच है कि बच्चों के सुनहरे करियर के लिए उन्हें अच्छी अंग्रेज़ी आना बहुत ज़रूरी है. अगर वो सिर्फ़ हिन्दी या अन्य भारतीय भाषाएं ही जानेंगे तो वे ऊंचे पदों तक नहीं पहुंच सकते.

अंग्रेज़ी को लेकर इतना क्रेज़ इसलिए भी ज़्यादा है क्योंकि इसे विश्व भर में संपर्क की भाषा माना जाता है. ये फ़िक्र भी रहती है कि संतान को बड़े होकर विदेश जाने का मौका मिलता है तो अच्छी अग्रेंजी जाने बिना वो कैसे दुनिया के दूसरे लोगों से संवाद (बातचीत) कर पाएगी? 

ऐसे ही सब सवालों के बीच मैं आपसे कहूं कि निकट भविष्य में ऐसी फ़िक्र करने की आपको कोई ज़रूरत नहीं रहेगी तो आपको अजीब लगेगा. जी हां, अब ना तो किसी भाषा के मृत होने का ख़तरा रहेगा और ना ही आपके लिए अंग्रेज़ी जैसी दूसरी भाषा को जानना मजबूरी रहेगा?  हां, आप शौक के लिए इसे सीखना चाहते हैं तो बात दूसरी है लेकिन ये आपके लिए अब अनिवार्यता नहीं रहेगा.

कैसे...आख़िर कैसे होगा ये सब?  इसका सीधा जवाब है तकनीक या टेक्नोलॉजी. आने वाले 50 वर्षों में तकनीक आपको ऐसी स्थिति में ले आएगी कि आपको अपनी भाषा के अलावा और किसी भाषा को सीखने की ज़रूरत नहीं रहेगी.

अपनी भाषा के हक में हम जब बात करते हैं, उसके अस्तित्व पर ख़तरा जताते हैं तो ये भूल जाते हैं कि तकनीक किस तरह चुपचाप दुनिया की तमाम भाषाओं के संरक्षण में लगी हुई है. बालेन्दु भाई के मुताबिक भारतीय भाषाओं के संरक्षण के लिए तीन चीज़ें बहुत अहम हैं और जिनका आज दुनिया में बहुत ज़ोर है और वो हैं-
1.     आर्टिफिशियल इंटेलीजेंस (AI)
2.     क्लाउड टेक्नोलॉजी
3.     बिग डेटा एनालिसिस  

आर्टिफिशियल इंटेलीजेंस और बिग डेटा एनालिसिस के बारे में आपने सुना होगा. वहीं क्लाउड टेक्नोलॉजी का इस्तेमाल इंटरनेट पर रखी हुई गई सामग्री के लिए होता है.

महान विचारक आर्थर सी क्लार्क के मुताबिक अगर कोई तकनीक समुचित रूप से विकसित हो जाती है तो वो किसी जादू या चमत्कार के समान ही होती है.

आर्टिफिशियल इंटेलीजेंस के साथ भी कुछ ऐसा ही है. इसी से संभव हो पाया है कि मशीन या कंप्यूटर में बोली हुई भाषा को समझने की क्षमता विकसित हो गई है. (जैसे कि अब मोबाइल पर आप बोलते हैं और वो खुद ही टाइप होता जाता है)

सीधी सी बात है कि कंप्यूटर आपके निर्देशों को समझने लगा है. WINDOWS में CORTANA नाम का एक सहायक आ गया है जिससे आप बात कर सकते हैं. किसी सवाल का जवाब जान सकते हैं जैसे कि आगरा में अभी कितना तापमान है और वो आपको जवाब देगा.

इसके मायने ये हैं कि कंप्यूटर से संवाद करने की दिशा में हम आगे बढ़ रहे हैं.

लिखी हुई पंक्तियों को बोलने की क्षमता के अलावा कंप्यूटर की देखने की क्षमता बहुत बढ़ गई है. वो अब लिखी हुई, छपी हुई, चित्रों के भीतर मौजूद शब्दों को समझने की क्षमता रखता है. माइक्रोसॉफ्ट ने ऐसी टेक्नोलॉजी बना ली है कि आपका कंप्यूटर बोलेगा तो आपकी आवाज़ में ही बोलेगा.

कंप्यूटर में आसपास की वस्तुओं और लोगों को पहचानने के साथ उनकी भावनाओं, उम्र, लिंग और हैंडराइटिंग तक को सही सही भांपने की क्षमता आ गई है. इसके लिए माइकोसॉफ्ट ने ही Video seeing AI नाम का ऐप विकसित किया है. जैसे कि एक महिला कंप्यूटर के पास आती है तो वो बता देगा कि 28 वर्षीय महिला चश्मा पहने हुए खुश दिखाई दे रही है.

जहां तक अनुवाद का सवाल है तो कंप्यूटर दुनिया की किसी भी भाषा का किसी दूसरी भाषा में अनुवाद करने लगा है. और ये वैसा मशीनी अनुवाद नहीं होता जैसा कि अभी तक आप मशीनी अनुवाद के दौरान कई हास्यास्पद स्थितियों को देखते रहे हैं...जैसे कि Around the clock को घड़ी के चारों ओर लिखा जाए.

आर्टिफिशियल इंटेलीजेंस के माध्यम से कंप्यूटर अपने आसपास के माहौल को समझने के बाद दूसरी भाषा में अनुवाद करेगा जिससे कि त्रुटियों की गुंजाइश ना के बराबर हो जाएगी और इनसान की तरह ही अनुवाद संभव हो सकेगा.

निष्कर्ष यही है कि तकनीक हमारी भाषाओं के लिए हौवा नहीं बल्कि उन्हें हमेशा हमेशा के लिए बचाने का काम कर सकती है. साथ ही ये दुनिया की सभी भाषाओं के बीच दूरियां खत्म करने के लिए सेतु का काम भी करेगी.

कितनी तेजी से ये काम हो रहा है इसका अंदाज इसी से लगाइए कि 2006 में गूगल ट्रांसलेटर और 2007 में माइक्रोसॉफ्ट ट्रांसलेटर शुरू हुआ और हम 10 साल में हम यहां तक पहुंच गए हैं. इसी से समझिए कि किस रफ्तार से तकनीक बढ़ रही है, भाषाओं के क्षेत्र में काम कर रही है. आर्टिफिशियल इंटेलीजेंस के लिए चार चीज़ें अहम हैं-

1.     ज्ञान यानि Knowledge- इसमें  80 फीसदी स्तर तक सफलता मिल चुकी है.
2.      दृष्टि यानि Vision-  96 फीसदी स्तर तक सफलता
3.      बोलना यानि Speech- 93 फीसदी स्तर तक सफलता
4.      भाषा यानि Language-  65 फीसदी स्तर तक सफलता

कंप्यूटर पर अनुवाद के दौरान जो त्रुटियां अभी दिखाई देती हैं वो इसी वजह से कि हम भाषा के क्षेत्र में 65 फीसदी स्तर तक ही पहुंचे हैं. जैसे जैसे ये स्तर बढ़ता जाएगा ये त्रुटियां कम होती जाएंगी. और जो ये लोग अभी कहते हैं कि कंप्यूटर कभी अनुवाद में इनसान की बराबरी नहीं कर सकता, उन्हें भी जवाब मिल जाएगा.

कंप्यूटर साइंस के जनक ऐलन टूरिंग का कहना है कि ये जरूरी नहीं कि इनसान किसी चीज़ के बारे में पहले से जानता हो, तभी उसे बना पाए. इससे ऐसे समझिए कि कंप्यूटर मशीन अंकगणित को जाने बिना ही बड़ी से बड़ी गणना बिना किसी त्रुटि कर सकता है. वो भी तब जब कि ये सिर्फ 0, 1 दो ही सिम्बल्स को पहचानता है.
इसी तरह कंप्यूटर किसी भाषा को जाने बिना दो भाषाओं के बीच परफेक्ट अनुवाद भी कर सकता है. इसके लिए वो सहारा लेता है Statistical Translation का जो  ग्रामर, भाषा ज्ञान पर आधारित नहीं बल्कि गणित पर आधारित होता है.

इसके लिए करोड़ों वाक्य एक भाषा में और करोड़ों अनुवाद दूसरी भाषा में तैयार किए जाते है. कंप्यूटर Parallel Corpus के आधार पर सीखता है कि आर्टिफिशियल इंटेलीजेंस का इस्तेमाल करते हुए अनुवाद कैसे होता है. हम अब क्लाउड की की दुनिया में हैं. जिस तरह से हम डेटा पैदा कर रहे हैं, हम अपने इंटरनेट, मेल, सर्च इंजन, अनुवाद में डेटा पैदा करते हैं वो सारा का सारा डेटा इंटरनेट पर इस्तेमाल किया जा सकता है यदि आपने उसकी अनुमति दी है.
इतने सारे डेटा का ही parallel corpus की तरह इस्तेमाल किया जाएगा तो कंप्यूटर बहुत तेजी से सीखने लगेगा. वही आर्टिफिशियल इंटेलीजेंस है. एक वक्त ऐसा भी आएगा कि कंप्यूटर अच्छे से अच्छे व्याकरणाचार्य से बेहतर अनुवाद करने लगेगा. आज नहीं तो कल वो करके दिखाएगा.

अब ये सब पढ़ने के बाद आप बताइए कि तकनीक भाषा के क्षेत्र में दुनिया के लोगों के बीच दूरियां घटाएगी या बढ़ाएगी?
बालेन्दु भाई अपनी बात पर केदारनाथ सिंह की इन पंक्तियों का सहारा लेते हुए विराम लगाते हैं-

मैं लौटता हूं तुम में, ओ मेरी भाषा
जैसे चीटिंयां लौटती हैं बिलों में,
जैसे कठफोड़वा लौटता है काठ पर,
जैसे विमान लौटते हैं सारे के सारे,
एक साथ डैने पसारे हुए
हवाई अड्डे की तरफ़,
उसी तरह मैं तुममें लौटता हूं मेरी भाषा,
जब चुप रहते रहते अकड़ जाती है मेरी जीभ,
और दुखने लगती है मेरी आत्मा...

इस वीडियो में बालेन्दु भाई को खुद ही सुनिए...





#हिन्दी_ब्लॉगिंग 







8 टिप्‍पणियां:

  1. आपकी इस प्रविष्टि् के लिंक की चर्चा कल बुधवार (11-04-2018) को ) "सिंह माँद में छिप गये" (चर्चा अंक-2937) पर होगी।
    --
    चर्चा मंच पर पूरी पोस्ट नहीं दी जाती है बल्कि आपकी पोस्ट का लिंक या लिंक के साथ पोस्ट का महत्वपूर्ण अंश दिया जाता है।
    जिससे कि पाठक उत्सुकता के साथ आपके ब्लॉग पर आपकी पूरी पोस्ट पढ़ने के लिए जाये।
    --
    हार्दिक शुभकामनाओं के साथ।
    सादर...!
    राधा तिवारी

    उत्तर देंहटाएं
  2. आपकी इस पोस्ट को आज की बुलेटिन घनश्याम दास बिड़ला और ब्लॉग बुलेटिन में शामिल किया गया है। कृपया एक बार आकर हमारा मान ज़रूर बढ़ाएं,,, सादर .... आभार।।

    उत्तर देंहटाएं
  3. कमाल की जानकारी ...बालेन्दु जी को साधुवाद ...और तुमको तो है ही इस जानकारी को हम तक लाने का ...

    उत्तर देंहटाएं
  4. बहुत ही उम्दा जानकारी दी सर, आपका लिखने का अंदाज बहुत ही लाजवाब है

    उत्तर देंहटाएं
  5. kaafi accha post hai .
    nice information
    thanks for sharing
    wasim recently posted..How to increase wordpress website speed

    उत्तर देंहटाएं