मशीन से सीखना हमारी संस्कृति को बदल रहा है
By भाषा | Published: June 1, 2021 12:48 PM2021-06-01T12:48:05+5:302021-06-01T12:48:05+5:30
निक केली, क्वींसलैंड प्रौद्योगिकी विश्वविद्यालय
क्वींसलैंड (ऑस्ट्रेलिया), एक जून (द कन्वरसेशन) हम में से अधिकांश लोग प्रतिदिन इस तथ्य से लाभान्वित होते हैं कि जब हम बोलते या लिखते हैं तो कंप्यूटर अब हमें ‘‘समझ’’ सकते हैं। हालांकि हम में से कुछ लोगों ने हमारी संस्कृति पर इसके संभावित हानिकारक प्रभावों के बारे में सोचने के लिए इसके इस्तेमाल को विराम दिया है।
मानव भाषा अस्पष्टता और दोहरे अर्थों से भरी है। उदाहरण के लिए, इस वाक्यांश के संभावित अर्थ पर विचार करें: ‘‘मैं प्रोजेक्ट क्लास में गया था’’। संदर्भ के बिना, यह एक अस्पष्ट बात है।
कंप्यूटर वैज्ञानिकों और भाषाविदों ने मानव भाषा की बारीकियों को समझने के लिए कंप्यूटर को प्रोग्राम करने की कोशिश में दशकों का समय बिताया है। और कुछ मायने में, कंप्यूटर पाठ को समझने और उत्पन्न करने की मनुष्यों की क्षमता के निकट आ रहे हैं।
हमारे उपकरणों में मौजूद प्रणालियां केवल कुछ शब्दों का सुझाव देती हैं, दूसरों का नहीं, इसके अलावा हमारी बात को पूरा कर देने वाली और पाठ के संभावित शब्द बता देने वाली प्रणालियां हमारे सोचने के तरीके को बदल देती हैं। इन सूक्ष्म, रोजमर्रा की बातचीत के माध्यम से, मशीन लर्निंग हमारी संस्कृति को प्रभावित कर रहा है। क्या हम इसके लिए तैयार हैं?
मैंने क्योगल राइटर्स फेस्टिवल के लिए एक ऑनलाइन परिसंवाद योजना बनाई है, जिससे आप हानिरहित तरीके से इस तकनीक को विस्तार से जान सकते हैं।
प्राकृतिक भाषा प्रसंस्करण क्या है?
कंप्यूटर के साथ बातचीत करने के लिए रोजमर्रा की भाषा के इस्तेमाल से जुड़े क्षेत्र को ‘‘प्राकृतिक भाषा प्रसंस्करण’’ कहा जाता है। हम इसका सामना तब करते हैं जब हम सिरी या एलेक्सा से बात करते हैं, या किसी ब्राउज़र में शब्द टाइप करते हैं और हमारे संभावित वाक्य को लिख दिया जाता है।
यह पिछले एक दशक में प्राकृतिक भाषा प्रसंस्करण में व्यापक सुधार के कारण ही संभव है - विशाल डेटासेट (आमतौर पर अरबों शब्दों) पर प्रशिक्षित परिष्कृत मशीन-लर्निंग प्रणाली के माध्यम से इसे तैयार किया गया।
पिछले साल, इस तकनीक की क्षमता तब स्पष्ट हुई जब जेनरेटिव प्री-ट्रेंड ट्रांसफॉर्मर 3 (जीपीटी-3) जारी किया गया। इसने बताया कि कंप्यूटर भाषा के साथ क्या कर सकता है।
जीपीटी-3 केवल कुछ शब्दों या वाक्यांशों को लेता है और एक वाक्य में शब्दों के बीच प्रासंगिक संबंधों को पकड़कर ‘‘सार्थक’’ भाषा में पूरे दस्तावेज़ तैयार कर सकता है। यह मशीन-लर्निंग मॉडल पर काम करके ऐसा करता है, जिसमें ‘‘बीईआरटी’’ और ‘‘ईएलएमओ’’ नामक दो व्यापक रूप से अपनाए गए मॉडल शामिल हैं।
यह तकनीक संस्कृति को कैसे प्रभावित कर रही है?
हालांकि, मशीन के जरिए सीखकर बनाई गई किसी भी भाषा के साथ एक महत्वपूर्ण समस्या है: वह जो कुछ जानते हैं, उसे आम तौर पर विकिपीडिया और ट्विटर जैसे डेटा स्रोतों से सीखते हैं।
वास्तव में, मशीन लर्निंग अतीत से डेटा लेता है, एक मॉडल बनाने के लिए उससे ‘‘सीखता है’’, और भविष्य में कार्यों को करने के लिए इस मॉडल का उपयोग करता है। लेकिन इस प्रक्रिया के दौरान, एक मॉडल अपने प्रशिक्षण डेटा से विकृत या समस्या खड़ी कर सकने वाली जानकारी भी ले सकता है।
यदि प्रशिक्षण डेटा पक्षपाती हो तो उसे चुनौती देने या ठीक करने की बजाय उसे मॉडल में जोड़ लिया जाएगा। उदाहरण के लिए, एक मॉडल कुछ पहचान समूहों या जातियों को सकारात्मक शब्दों के साथ, और अन्य को नकारात्मक शब्दों से जोड़ सकता है, जिससे कई बार गंभीर समस्या पैदा हो सकती है।
मशीन लर्निंग के साथ समस्या यह है कि कुछ अवधारणाओं के बीच इसका जो जुड़ाव होता है वह इसके भीतर ही छिपा रहता है; हम उन्हें देख या छू नहीं सकते। मशीन लर्निंग मॉडल को और अधिक पारदर्शी बनाने के तरीकों पर शोध किए जा रहे हैं।
Disclaimer: लोकमत हिन्दी ने इस ख़बर को संपादित नहीं किया है। यह ख़बर पीटीआई-भाषा की फीड से प्रकाशित की गयी है।