कुठलंही नवीन तंत्रज्ञान आलं की त्याच्या स्वीकारार्हतेच्या बाबतीत चढ -उतार येतातच, असा आजपर्यंतचा अनुभव आहे. ‘गार्टनर’ या प्रसिद्ध जागतिक संशोधन संस्थेने याला तंत्रज्ञानाची ‘हाइप सायकल’ असं नाव दिलेलं आहे. या ‘हाइप सायकल’चे साधारण पाच टप्पे मानले जातात. पहिल्या टप्प्यात नव्या तंत्रज्ञानाबद्दल मोठ्या प्रमाणावर उत्सुकता असते. दुसऱ्या टप्प्यात मोठ्या अपेक्षा निर्माण होतात. त्या अपेक्षा पूर्ण करण्याइतकी त्या तंत्रज्ञानाची प्रगती अर्थातच झालेली नसते आणि ती तेवढ्या गतीनेही होत नसते. त्यातून तिसऱ्या टप्प्यात अपेक्षाभंगाचा काळ येतो. त्या तंत्रज्ञानाची प्रगती खुंटते. मग चौथ्या टप्प्यात हळूहळू तंत्रज्ञ त्या तंत्रज्ञानाच्या व्यावहारिकतेचा पुनर्विचार करतात. एक नवीन उत्साह येतो, पण तो अधिक सजग असतो. या टप्प्यात तंत्रज्ञानाचे अनेक उपयोग शोधले जातात आणि ते प्रत्यक्षात आणले जातात. शेवटच्या आणि पाचव्या टप्प्यात तंत्रज्ञान बऱ्यापैकी परिपक्व आणि सार्वत्रिक होतं.
याची चर्चा इथे का करायची?
आधीच्या लेखात म्हटलं तसं, १९७०चं दशक कृत्रिम बुद्धिमत्तेच्या क्षेत्रातील मंदीचं दशक मानलं जातं. तेव्हा हे तंत्रज्ञान या ‘हाइप सायकल’च्या तिसऱ्या टप्प्यात होतं, असं म्हणता येईल. म्हणजेच अपेक्षाभंगाचं पर्व! ते तिथपर्यंत कसं आलं हे पहिल्यांदा बघू.
१९५०च्या ट्युरिंगच्या शोधनिबंधाने आणि १९५६च्या डार्टमाऊथ परिषदेनंतर हे तंत्रज्ञान एक संशोधन क्षेत्र म्हणून आकारास आलं. तंत्रज्ञांची अपेक्षा होती, की पुढच्या दोन दशकांत माणसाला तुल्यबळ अशी बुद्धिमत्ता यंत्रामध्ये म्हणजेच संगणकामध्ये आणणं शक्य होईल. त्यामुळे विविध क्षेत्रांत त्याचा उपयोग करता येईल. हे साधण्यासाठी तंत्रज्ञ मानवी बुद्धीच्या स्वरूपाचा सर्वंकष अभ्यास करू लागले.
प्राण्यांमधील बुद्धी हा तीन गोष्टींचा सहयोग असतो- इंद्रियं, इंद्रियांकडून येणाऱ्या संदेशाचं वहन करणारं मज्जासंस्थेचं जाळं आणि मेंदू. मेंदूत या संदेशाचं संकलन आणि साठवण केली जाते. हीच प्राण्यांची भोवतालातून शिकण्याची प्रक्रिया असते. नैसर्गिक बुद्धीची ही क्रिया इंद्रियांपासून ते मेंदूपर्यंत विद्युत-रासायनिक प्रक्रियांमधून घडत असते. परंतु माणूस आणि इतर प्राण्यांमध्ये मुख्य फरक असा, की माणसाच्या मेंदूत या संदेशांचं विलेषण करण्याची क्षमता अधिक असते. माणसाकडे भाषेचं मोठं साधन असतं. भाषेच्या माध्यमातून हे विलेषण मांडणं आणि इतरांपर्यंत पोहोचवणं माणसाला शक्य होतं. इतर प्राणीदेखील बुद्धिमान असतातच, पण माणसाच्या बुद्धिमत्तेचा पोत थोडा वेगळा असतो.
या सगळ्या पार्श्वभूमीवर कृत्रिम बुद्धिमत्तेचं तंत्रज्ञान निर्माण करण्याच्या दृष्टीने १९५०च्या दशकात तंत्रज्ञांमध्ये बरंच विचारमंथन झालं. या तंत्रज्ञानाचा वेगाने विकास व्हावा यासाठी दोन ढोबळ मार्ग निवडले गेले. पहिला म्हणजे मनुष्याचे भाषाग्रहणाचे व व्यक्त होण्याचे उपजत नियम समजून घेऊन त्यांना सामावून घेणारी संगणक प्रणाली लिहिणं. यातून संगणक हा माणसासाठी एक संवादक व प्रभावी ‘भाषांतरकार’ होऊ शकतो, असा तंत्रज्ञांचा अंदाज होता. अमेरिका आणि रशिया यांच्यातील तत्कालीन शीतयुद्धामुळे भाषांतरकारांना बरीच मागणी होती. निदान काही प्रमाणात संगणकाने ही मागणी पूर्ण केली तर हवीच होती.
हेही वाचा - बुद्धिमान यंत्रं : जब दिल्ली दूर थी
त्यानुसार शब्द, व्याकरण व वाक्यरचनेचे नियम या दृष्टीने भाषा अभ्यासली गेली. ध्वनिमुद्रणाचं तंत्रज्ञान तोपर्यंत बऱ्यापैकी प्रगत झालेलं होतं. उच्चारलेल्या शब्दांमधून निर्माण होणाऱ्या ध्वनिलहरींचे गुणधर्म संगणकात साठवून ठेवायचे आणि दुसऱ्या कोणाच्याही बोलण्यात आलेल्या शब्दांच्या ध्वनिलहरींची या गुणधर्मांशी तुलना करून संगणकामार्फत ते शब्द ओळखायचे प्रयत्न सुरू झाले. बेल टेलिफोन लॅबोरेटरीज आणि आयबीएमसारख्या अग्रगण्य संस्थांना त्यात माफक यश मिळालं. मुख्य आव्हान होतं ते वाक्यरचनेच्या नियमांची प्रणाली लिहून संपूर्ण वाक्याचा मथितार्थ संगणकामार्फत समजावून घेण्याचं. जॉन मकॉर्थी आणि मर्विन मिन्की यांनी बोस्टन-एमआयटीत स्थापन केलेल्या कृत्रिम बुद्धिमत्तेच्या प्रयोगशाळेत असे प्रयत्न केले गेले.
या प्रयोगशाळेत १९६७मध्ये जोसेफ विझेनबाम या जर्मन-अमेरिकन संगणक शास्त्रज्ञाने एङ्खनअ ही प्रणाली एक संवादक (चॅटबॉट) म्हणून बांधली. ढोबळमानाने त्यात मानसोपचारतज्ज्ञ आणि रुग्ण यांच्यातल्या प्राथमिक संवादाचं स्वरूप होतं. उदाहरणार्थ, त्या प्रणालीबरोबर संवाद साधताना कोणी टाइप केलं, ‘मला वाईट वाटतं आहे’, तर ELIZAकडून स्क्रीनवर वाक्य उमटायचं- ‘तुम्हाला का वाईट वाटतं आहे?’ ELIZAच्या साठवणीत नसलेला एखादा प्रश्न किंवा वाक्य टाइप केलं, तर स्क्रीनवर ‘हां, हे इन्ट्रेस्टिंग आहे!’ किंवा ‘पुढे बोला’ अशी सरधोपट उत्तरं उमटण्याची सोय होती. या पलीकडे मात्र ELIZA फारशी प्रगती करू शकलं नाही.
याउलट, १९६८ साली याच प्रयोगशाळेत निर्माण करण्यात आलेली SHRDLU ही प्रणाली थोडी अधिक प्रगत होती. विशिष्ट क्रमाने दिलेल्या सूचना साठवून त्याबरहुकूम उत्तर देण्याची तिची क्षमता होती. यासाठी प्रात्यक्षिक म्हणून वेगवेगळ्या रंगांचे ठोकळे काल्पनिकपणे रचण्याच्या सूचना वापरल्या गेल्या. ‘आधी लाल रंगाचा ठोकळा, नंतर त्यावर हिरव्या रंगाचा घनाकृती ठोकळा व शेवटी निळ्या रंगाचं पिरॅमिड, असं एकावर एक रचून ठेवा’. संगणकाला अशा केवळ सूचना देऊन प्रश्न विचारला, ‘घनाकृती ठोकळा कुठल्या रंगाचा आहे?’ तर SHRDLU अचूकपणे त्याचं उत्तर ‘हिरव्या रंगाचा आहे’ असं द्यायची. (म्हणजे घनाकृती ठोकळा हिरव्या रंगाचा आहे, हे वेगळ्या प्रकारे सांगितलं तरी ही प्रणाली तो संदर्भ लक्षात ठेवायची.) या ठोकळ्यांच्या रचनेवर आधारित वेगवेगळे प्रश्न विचारले तरी ही प्रणाली कमी-अधिक प्रमाणात त्याचं बरोबर उत्तर देऊ शकायची.
परंतु या उदाहरणांपलीकडे एका व्यापक दृष्टीने भाषा समजून घेणारी प्रणाली निर्माण करणं शक्य झालं नाही. त्याची कारणं भाषेच्या स्वरूपात दडलेली आहेत.
भाषा म्हणजे निव्वळ शब्द, त्यांचे अर्थ, व्याकरण व वाक्यरचनांचे नियम नव्हेत. एखाद्या लेखातील परिच्छेद, परिच्छेदातील वाक्यं आणि वाक्यातील शब्द या सगळ्याला एक सुसंगत संदर्भ असतो. त्या संदर्भातूनच त्या लिखाणाचा अर्थ समजावून घेणं महत्त्वाचं असतं. उदा. ‘सूर्याचा लख्ख प्रकाश पडला’ आणि ‘त्याच्या डोक्यात प्रकाश पडला’ या दोन वाक्यांतील ‘प्रकाश’ या शब्दाचा अर्थ त्या-त्या संदर्भाने आपल्याला समजतो. कोणत्याही भाषेत वाक्यांना व त्यातील शब्दांना असे असंख्य संदर्भ असू शकतात. ते सर्व एका संगणक प्रणालीमध्ये बद्ध करणं ही अशक्यप्राय गोष्ट आहे हे संशोधकांच्या लक्षात आलं. असे संदर्भ साठवून ठेवण्याची त्या काळातल्या संगणकांची क्षमतादेखील मर्यादित होती. भाषांतर ही तर पुढची अधिक कठीण पायरी, कारण त्यात दुसऱ्या भाषेचीही गुंतागुंत येते. इथूनच मानवी भाषेच्या दृष्टीने केल्या जाणाऱ्या कृत्रिम बुद्धिमत्तेच्या संशोधनाला ओहोटी लागली.
हेही वाचा - एआय टूल्स : कितपत विश्वासार्ह?
संशोधनासाठीचा दुसरा मार्ग थोडा वेगळा होता. बुद्धीचे तीन पदर- इंद्रियं, मज्जातंतूचं जाळं आणि मेंदू. यांतील मज्जातंतूंचं जाळं कृत्रिम प्रकारे बांधणं (आर्टिफिशियल न्युरल नेटवर्क) हा या मार्गाचा मुख्य उद्देश होता. कसा?
बालवाडीतील एखाद्या मुलाला आपण दोन प्रकारची चित्रं (उदा. कुत्रा किंवा मांजर) असलेले अनेक फोटो दिले आणि त्या फोटोंचं या दोन प्रकारांमध्ये वर्गीकरण करायला सांगितलं, तर ते मूल हे काम सहज करून दाखवतं. कारण कुत्रा आणि मांजर यांच्यातले वेगवेगळे फरक केवळ नजरेने ओळखायला ते शिकलेलं असतं. लहान मुलाइतक्याच सहजतेने हे काम करू शकणारी संगणक प्रणाली निर्माण करायची, त्यासाठी कृत्रिम मज्जातंतूंच्या जाळ्याचा वापर करायचा, अशी संशोधकांची योजना होती.
आपण एखादी वस्तू बघतो तेव्हा नैसर्गिक मज्जातंतूंच्या जाळ्यामधून डोळ्यांतील संवेदना मेंदूपर्यंत पोहोचवली जाते. त्या संदेशाच्या स्वरूपानुसार काही मज्जातंतू सक्रिय होतात, तर काही निष्क्रिय राहतात. मज्जातंतूंना जोडणारे बंध यात प्रमुख भूमिका बजावतात. तो संदेश ज्या स्वरूपात मेंदूपर्यंत पोहोचतो त्यानुसार आपल्याला समोरचं दृश्य दिसतं आणि ओळखता येतं. ही संकल्पना कृत्रिमपणे संगणक प्रणालीमध्ये आणण्यात फ्रँक रोजेनब्लाट या अमेरिकन संशोधकाने पुढाकार घेतला.
रोजेनब्लाट यांच्या प्रयोगात दोन प्रकारच्या प्रतिमा निवडल्या गेल्या- एक चौकट (शंकरपाळ्याचा आकार असलेली) आणि दुसरी चौरस. चारशे प्रकाश संवेदकांची (फोटो सेन्सर्स) एक आयताकृती रचना करून प्रतिमेला वेगवेगळ्या भागांतून जोखणं, अशी ही व्यवस्था होती. म्हणजे हे संवेदक आपल्या डोळ्यांचं काम करणार होते. त्यातील प्रत्येक संवेदकाला कृत्रिम मज्जातंतूंच्या जाळ्याशी जोडलं गेलं. या जाळ्यात हजारो शिकाऊ घटक (ट्रेनेबल पॅरामीटर्स) होते. कृत्रिम मज्जातंतूंचं सक्रिय असणं/नसणं नियंत्रित करता यावं यासाठी त्यांची योजना होती. या प्रयोगासाठी चौकट आणि चौरसाच्या एकूण साठ प्रतिमा वापरल्या गेल्या. रोजेनब्लाट यांच्या प्रणालीने या प्रतिमांचं शंभर टक्के अचूक वर्गीकरण केलं. ही कल्पकतापूर्वक बांधलेली प्रणाली कृत्रिम बुद्धिमत्तेच्या विकासात मूलभूत दृष्टिकोन देणारी ठरली.
परंतु या प्रणालीतला ‘शिकण्याचा’ अल्गोरिदम प्राथमिक स्वरूपाचा होता. अधिक क्षमतेची प्रणाली बांधायची तर त्यासाठी कृत्रिम मज्जातंतूंचं अधिक मोठं जाळं गरजेचं होतं, ज्यामुळे शिकाऊ घटकांची संख्या वाढली असती. मात्र, त्या काळातली संगणक तंत्रज्ञानातील प्रगती बघता याला मर्यादा होत्या.
थोडक्यात काय, तर १९७०च्या दशकात कृत्रिम बुद्धिमत्तेच्या संशोधन प्रयत्नांना फारसं यश आलं नाही.
हेही वाचा - एआय मानवी कलाकारांना पूरक आहे की स्पर्धक?
तंत्रज्ञानाची प्रगती थंडावली तरी संशोधन चालूच राहिलं. १९८०च्या दशकात सेमीकंडक्टर तंत्रज्ञानातील प्रगतीमुळे संगणक अधिकाधिक वेगवान आणि सक्षम होत होते. त्यामुळे कृत्रिम बुद्धिमत्तेसाठी संगणकाला शिकवण्याच्या ‘अल्गोरिदम’ निर्मितीमध्ये पूर्णपणे नवीन दृष्टी देण्याचे प्रयत्न सुरू झाले. त्यासाठी जॉन होपफील्ड या भौतिकशास्त्रज्ञाचं संशोधन कामी आलं. शरीरातील मज्जातंतूंचं नैसर्गिक कार्य भौतिकशास्त्रातील नियमांनुसार कसं चालतं याची उकल होपफिल्ड यांनी केली. त्यांच्या संशोधनामुळे मज्जातंतूंच्या जाळ्याला आणि त्याच्या कार्याला एक व्यापक आणि भक्कम गणिती स्पष्टता आली. परिणामी, कृत्रिम मज्जातंतूंचं जाळं कशा प्रकारे बांधता येईल आणि त्याचे मापदंड काय असतील याचा अंदाज कृत्रिम बुद्धिमत्ता संशोधकांना आला.
होपफील्ड यांचं हे कार्य आणखी पुढे नेलं ते जेफरी हिंटन या ब्रिटिश संशोधकाने. हिंटन यांनी भौतिकशास्त्रातील तत्त्वांवर आधारित अशा कृत्रिम जाळ्याची मांडणी केली, जे स्वत:च स्वत: शिकू शकणारं होतं. त्यांनी त्यासाठी एक ठोस गणिती अल्गोरिदमदेखील शोधला. तपशीलांच्या खोलात न शिरता हे समजून घेऊ. आपण एखादं गणित सोडवताना विशिष्ट पायऱ्यांनी जातो. उत्तर चुकलं तर एक-एक पायरी मागे जाऊन चूक शोधतो आणि ती दुरुस्त करून परत उत्तराकडे येतो. तरी उत्तर चुकत असेल तर पुन्हा मागे जातो, आणखी कुठल्या पायरीवर चूक आहे का ते शोधतो. म्हणजे चुकलेलं उत्तर आणि बरोबर उत्तर यांच्यातलं अंतर आपण कमी कमी करत नेतो. हिंटन यांचा अल्गोरिदम अशाच प्रकारे काम करणारा होता. कृत्रिम मज्जातंतूंच्या जाळ्यात गणिताप्रमाणेच अनेक पायऱ्या असतात आणि प्रत्येक पायरीवर अनेक शिकाऊ घटक असतात. समजा, या जाळ्यामधून आपण चौरसाची प्रतिमा पाठवली; पण जाळ्याला ती ओळखता आली नाही, तर चूक शोधण्यासाठी तो अल्गोरिदम मागे मागे जात प्रत्येक पायरीवरील घटकांमध्ये विशिष्ट प्रकारचे बदल करतो आणि जाळ्याकडून येणारं उत्तर चौरसाकडे नेऊ शकतो.
अधिक संशोधनाअंती लक्षात आलं, की चौरस असलेल्या व नसलेल्या अनेक वेगवेगळ्या प्रकारच्या प्रतिमा या कृत्रिम जाळ्यामधून पाठवून आणि प्रत्येक वेळेस त्यातील हजारो शिकाऊ घटक योग्य दिशेने बदलत नेऊन या जाळ्याची भाकीत करण्याची क्षमता अधिक अचूक आणि व्यापक करता येते.
या संशोधनामुळे १९८०च्या दशकात कृत्रिम बुद्धिमत्ता क्षेत्राला पुन्हा उभारी मिळाली. (होपफील्ड आणि हिंटन यांच्या या कार्यासाठी दोघांना गेल्या वर्षी भौतिकशास्त्राचं नोबेल पारितोषिक देण्यात आलं.) हिंटन यांच्या अल्गोरिदममुळे कृत्रिम बुद्धिमत्तेचा व्यावहारिक उपयोग दृष्टिपथात आला. याच दशकाच्या शेवटी यान लेकोन या फ्रेंच संगणकतज्ज्ञाने कृत्रिम मज्जातंतूंच्या जाळ्याचा एक वेगळा आकृतिबंध तयार केला. हे जाळं आठ पायऱ्या आणि साठ हजार शिकाऊ घटक अशा स्वरूपाचं होतं. अशा जाळ्याला एका वेळेस सगळी प्रतिमा एकदम दाखवण्याऐवजी ती तुकड्या-तुकड्याने दाखवण्याची कल्पना लेकोनने मांडली. कृत्रिम जाळं प्रतिमेतील वेगवेगळ्या ठिकाणचे बारकावे टिपू शकेल, असं गृहीत धरून त्याने प्रयोग केले. या सगळ्या बारकाव्यांना एकत्रित करून त्या प्रतिमेविषयीचं भाकीत अधिक अचूक होत असल्याचं प्रयोगाअंती सिद्ध झालं.
हेही वाचा - एआयचा जमाना: देखिले डोळा, खरे खोटे समजेना
अमेरिकेच्या टपालखात्यात याचा लगेचच उपयोग केला गेला. हाताने लिहिलेल्या पिनकोडचा फोटो कृत्रिम मज्जातंतूंच्या जाळ्यातून पाठवला की त्यावरून हे जाळं तो विशिष्ट पिनकोड असलेलं सगळं टपाल वेगळं काढू शकतं. या तंत्रज्ञानामुळे टपालाचं वर्गीकरण करण्याचं पूर्वी वेळखाऊ असणारं काम अतिशय वेगाने होऊ लागलं. १९९०च्या दशकात इतरही वेगवेगळ्या ठिकाणी याचा उपयोग केला जाऊ लागला- उदा. बँकांमध्ये चेक वाचणं किंवा कारखान्यात सदोष उत्पादन वेगाने शोधणं.
कृत्रिम मज्जातंतूंच्या तंत्रज्ञानाबरोबर संगणकाला शिकण्यासाठी आणि भाकितासाठी इतरही वेगळ्या प्रकारे अल्गोरिदम निर्माण होत आलेले आहेत. उदा. सपोर्ट वेक्टर मशिन (१९९६) किंवा रँडम फॉरेस्ट (२००१). प्रतिमांचं वर्गीकरण आणि मानवी भाषा यांच्या पलीकडे परंतु तुलनेने छोट्या स्तरावर या अल्गोरिदमचा प्रचंड उपयोग होतो. या अल्गोरिदमचा फायदा असा, की भाकितं करत असताना भाकिताची कारणमीमांसा करणं शक्य असतं. (कृत्रिम जाळ्यांच्या बाबतीत त्यांच्या गुंतागुंतीमुळे हे शक्य होत नाही. कृत्रिम जाळ्यांची ही मर्यादा इथे अधोरेखित करणं आवश्यक आहे.)
१९९०नंतर कृत्रिम बुद्धिमत्तेचं तंत्रज्ञान विविध क्षेत्रांत उपयोगात येऊ लागलं तरी २०१०च्या दशकात या तंत्रज्ञानाने नेत्रदीपक प्रगती केली. त्यामागची कारणं समजून घेऊ.
यान लेकोनने प्रतिमा वर्गीकरणासाठी बांधलेलं जाळं मोठं करून, त्यातल्या शिकाऊ घटकांची संख्या वाढवून अधिक वेगवेगळ्या आणि गुंतागुंतीच्या प्रतिमांचं वर्गीकरण होऊ शकेल याची संशोधकांना कल्पना होती, परंतु त्यासाठी समांतरपणे आकडेमोड करणाऱ्या संगणकाची गरज होती. जेन्सन हुआंग या तैवानी तंत्रज्ञाने १९९०मध्ये सुरू केलेल्या एनविडिया या कंपनीने व्हिडिओ गेमसाठी असे संगणक तयार केले होते. २०१०पर्यंत मोठ्या कृत्रिम जाळ्यांना शिकवण्यासाठी वापरता येतील असे विशेष संगणकही एनविडियाने तयार केले. त्यांच्या क्षमतेवरती शिक्कामोर्तब झालं २०१२मध्ये इमेजनेट स्पर्धेने! एनविडियच्या विशेष संगणकांमुळेच जेफरी हिंटन यांचा गट स्पर्धेत विजयी ठरला. या स्पर्धेत जेफरी हिंटन यांच्या गटाने वापरलेलं प्रतिमा वर्गीकरणाचं तंत्र स्मार्टफोन, विमानतळ सुरक्षा ते रोगनिदान अशा सर्व ठिकाणी उपयोगात आणलं जाऊ लागलं.
मानवी भाषाग्रहणाच्या बाबतीत कृत्रिम मज्जातंतूंचं जाळं वापरून अशीच प्रगती साधली गेली. हे जाळं भाषेतले संदर्भ आणि वाक्यरचनेचे नियम आपोआप समजावून घेईल असे प्रयत्न केले गेले. शब्दांचं आणि वाक्यांचं संदर्भानुसार वर्गीकरण करण्याचं तंत्रज्ञान विकसित झालं. उदा. ही तीन वाक्यं वाचा : ‘प्रवास सुरू झाला. दुपारची उन्हं उतरल्यावर आम्ही तिथे पोहोचलो. अंधार व्हायच्या आधी रात्रीसाठी मुक्काम शोधला.’ आता ‘दुपार’ व ‘उन्हं’ आणि ‘अंधार’ व ‘रात्र’ हे जवळचे निगडित शब्द आहेत. याउलट, ‘प्रवास’ व ‘मुक्काम’ हे तुलनेने दूर असले तरी संदर्भाने संबंधित शब्द आहेत. तर, अर्थाने आणि संदर्भाने एकत्रित असलेल्या शब्दांचं कृत्रिम जाळ्यामार्फत गणिती पद्धतीने वर्गीकरण केलं गेलं. यासाठी मोठ्या प्रमाणात लिखित मजकूर वापरला गेला. यातून एखाद्या वाक्यातील क्रमाने येणाऱ्या शब्दांच्या संदर्भानुसार पुढील शब्दाचं भाकीत करणं सहज शक्य झालं; परंतु यालाही मर्यादा आल्या. ही भाकितं करणारी जाळी फार तर एक किंवा दोन वाक्यांआधीचे संदर्भ साठवून ठेवू शकायची. पूर्ण परिच्छेद किंवा त्याहीपेक्षा लांबचे संदर्भ समजतील अशी त्या जाळ्यांची रचना नव्हती. त्यामुळे एक पूर्ण परिच्छेद किंवा पूर्ण मजकूर संदर्भ म्हणून एकाच वेळेस देऊन त्यातील शब्दांच्या, वाक्यांच्या जागा व त्यांचे एकमेकांशी असलेले संबंध एकदमच शिकणारं वेगळ्या प्रकारचं कृत्रिम जाळं तयार करण्याविषयी खल सुरू झाला. असं जाळं पहिल्यांदा निर्माण केलं गुगलमधील संशोधकांनी. २०१७ साली प्रसिद्ध झालेला या बाबतीतला शोधनिबंध खूपच परिणामकारक ठरला.
हेही वाचा - चाहूल नव्या वसाहतवादाची
अशा जाळ्यांची कल्पना इतर तंत्रज्ञ आणि संशोधकांनी खूप पुढे नेली. त्यासाठी तोपर्यंत प्रसिद्ध झालेली इंग्रजीतील सर्व पुस्तकं, शास्त्रीय शोधनिबंध, महाजालावरील कोट्यवधी वेबसाइट्सवरची माहिती यांचा वापर करून प्रशिक्षित केलेली कृत्रिम जाळी बनवण्यात आली. या जाळ्यांमध्ये कोट्यवधी शिकाऊ घटक होते. एवढ्या प्रचंड माहितीने शिकवण्यात आलेल्या जाळ्यात भाषेतील सूक्ष्मातिसूक्ष्म संदर्भ आत्मसात केले गेले. काही कंपन्यांनी या शिकलेल्या कृत्रिम जाळ्यांशी संवाद साधता येईल अशी संवादक प्रणाली लिहिली. विचारलेल्या प्रश्नाच्या संदर्भाने
ही प्रणाली अतिशय मुद्देसूद उत्तर देऊ शकते. चॅट-जीपीटी ही अशाच प्रकारच्या प्रयत्नांतून तयार झालेली प्रणाली आहे.
आजच्या घडीला सगळ्यात मोठ्या शिकवल्या गेलेल्या कृत्रिम जाळ्यामध्ये अब्जावधी शिकाऊ घटक आहेत. फक्त भाषाच नाही तर प्रतिमा आणि ध्वनी समजावून घेण्याची क्षमता त्यांच्यात आलेली आहे. ही जाळी निर्मितीक्षमदेखील आहेत- म्हणजे विचारलेल्या प्रश्नानुसार किंवा सूचनेनुसार पूर्ण नवीन कविता, प्रतिमा किंवा व्हिडिओ निर्माण करू शकत आहेत. हे तंत्रज्ञान असं सर्वव्यापक करण्याकडे संशोधकांचा कल दिसतो.
चॅट-जीपीटीबरोबर केलेला संवाद कितीही वास्तविक वाटला तरी ‘संदर्भानुसार भाकीत’ हे त्याचं मूलभूत तत्त्व आहे, हे पुन्हा नमूद करावंसं वाटतं. त्यामुळे त्यातून येणाऱ्या उत्तराला पूर्ण खरं न मानता या वस्तुस्थितीचं भान ठेवणं आवश्यक आहे.
आपण ‘कृत्रिम मज्जातंतूंचं जाळं’ म्हणतो, तसंच त्याचं स्वरूप शरीरातील मज्जातंतूंसारखं आहे असं म्हणतो; मात्र हे अर्धसत्य आहे. आपली चेतासंस्था अब्जावधी वर्षांच्या उत्क्रांतीतून निर्माण झालेली अत्यंत गुंतागुंतीची संस्था आहे. माणसाच्या बुद्धीला अनेक पैलू असतात- भोवतालच्या जाणिवेतून आपोआप ज्ञान करून घेणं, स्मरणशक्ती आणि निर्मितीक्षमता. हे पैलू एकमेकांत गुंफलेले असतात. त्यामुळे तंत्रज्ञांनी निर्माण केलेली कृत्रिम जाळी कितीही बलाढ्य असली तरी नैसर्गिक मज्जातंतूंच्या तुलनेत अगदीच प्राथमिक आहेत. फार तर असं म्हणता येईल, की त्यांची बांधणी नैसर्गिक मज्जातंतूंपासून प्रेरित झालेली आहे. माणसाच्या बुद्धीचे सर्व पैलू एकाच प्रणालीत आणू शकणारं तंत्रज्ञान निर्माण होणं ही अजून बरीच दूरची गोष्ट आहे.
आणखी दहा-वीस वर्षांनी कृत्रिम बुद्धिमत्ता तंत्रज्ञान कसं असेल, ते कुठल्या दिशेने जाईल हे सांगणं कठीण आहे. आज दैनंदिन पातळीवर कळत-नकळत ते आपल्या आयुष्याचा अविभाज्य घटक बनलं आहे. पुढे त्याचा प्रभाव वाढत जाणार आहे हे नक्की.
(अनुभव, फेब्रुवारी २०२५च्या अंकातून साभार.)
श्रीनिवास पंढरपुरे | pshrini@gmail.com
श्रीनिवास पंढरपुरे कृत्रिम बुद्धिमत्ता क्षेत्रात कार्यरत आहेत. विज्ञान, खगोलशास्त्र आणि विज्ञानप्रसारात त्यांना विशेष रुची आहे.
