एआय टूल्स : कितपत विश्वासार्ह?

#ai #artificial-intelligence #technology #preeti-chhatre

अनेकजण आता आपल्या दैनंदिन कामात चॅटजीपीटी (किंवा त्यासारखी इतर टूल्स) वापरायला लागले आहेत. कार्यालयीन पत्रं/इमेल्स लिहिणं, एखाद्या कामाचं प्लॅनिंग करून देणं, अशी कामं ही टूल्स करू शकतात. त्यांना विचारलेल्या प्रश्नांची उत्तरं ते देऊ शकतात. आपण एखाद्या विषयाची माहिती विचारली तर ते ती माहिती सांगतात. थोडक्यात सांग म्हटलं तर थोडक्यात सांगतात. आपण सविस्तर उत्तराची मागणी केली तर तशी सविस्तर माहिती देतात.

ही टूल्स म्हणजे ‘एआय-मदतनीस’ आहेत. अनेकांना त्यांची चॅट-सोबत आवडते. त्यांच्याशी बोलायला आवडतं. त्यांच्याशी सल्ला-मसलत करायला आवडतं. अगदी त्यांच्याजवळ मन मोकळं करायलाही आवडतं.

...आणि आता अधिकाधिक दिसून येतंय, की हे मदतनीस प्रश्नकर्त्याला कायम अचूक उत्तरं देतातच असं नाही. प्रश्नकर्त्याच्या बोलण्याचा एकूण सूर बघून ते त्यानुसार स्वतःचे प्रतिसाद बदलतात. थोडक्यात, ते माणसाच्या ‘हो’ला ‘हो’ करतात, ‘नाही’ला ‘नाही’ म्हणतात. काही वेळा प्रश्न विचारणारा आणखी कुणाला इजा करू शकतो याची कल्पना आली तरीही त्याची चूक दर्शवण्याऐवजी त्याचंच बरोबर आहे, असं सांगण्याकडे त्यांचा कल असतो.

हा काय प्रकार आहे?

ही टूल्स ‘एआय’वर आधारित असलेली ‘लार्ज लँग्वेज मॉडेल्स (एलएलएम)’ आहेत. अशी मॉडेल्स अत्यंत प्रगत आणि गुंतागुंतीच्या गणिती प्रक्रियांवर आधारलेली असतात. म्हणजे हे मदतनीस ‘उचलली जीभ लावली टाळ्याला’ असं तर नक्की करत नाहीत. मग हा प्रकार कशामुळे घडतो?

हेही वाचा - एआयचा जमाना: देखिले डोळा, खरे खोटे समजेना

त्यासाठी आधी ही टूल्स कसं काम करतात, हे थोडक्यात बघू.

अगदी सोप्या भाषेत सांगायचं, तर कोणत्याही ‘एलएलएम’ला आपण एखादं अर्धवट वाक्य इनपुट म्हणून दिलं, तर त्या वाक्यातला पुढचा शब्द कोणता असेल याचा अंदाज बांधणं हे त्या मॉडेलचं काम. बस्स. ते मॉडेल बाकी काहीही करत नसतं. त्यातल्या त्यात बरोबर वाटणारे काही शब्द वाक्याच्या शेवटी टाकून पुन्हा त्यापुढच्या शब्दाचे अंदाज बांधायचे, मग त्यापुढे, असं करत करत आऊटपुट तयार होतं. हे आऊटपुट म्हणजे आपण त्याला विचारलेल्या प्रश्नाचं उत्तर असू शकतं, किंवा आपण त्याला लिहायला सांगितलेला इमेल मजकूर असू शकतो.

मात्र इथे दोन-चार वाक्यांचा अथवा तीस-चाळीस शब्दांचा विषय चाललेला नाही. ‘एलएलएम’ला आधी प्रचंड प्रमाणात माहिती पुरवलेली असते- हजारो-लाखो पुस्तकं, विकीपेडिया, संशोधनलेख, निबंध वगैरे. ते सगळे मजकूर धुंडाळून तो अंदाज बांधण्याचं काम करत असतो.

तो ‘मदतनीस’ असल्यामुळे त्याने नम्र भाषा वापरणं अपेक्षित असतं. त्याची उत्तरं अथवा त्याने पुरवलेली माहिती वापरकर्त्यासाठी उपयोगी असायला हवी, असं अपेक्षित असतं. त्यासाठी त्याला प्रशिक्षित करावं लागतं. हे प्रशिक्षण दोन प्रमुख टप्प्यांत होतं. अमुक प्रकारच्या प्रश्नांना तमुक प्रकारे उत्तरं द्यायला हवीत, हे त्या मॉडेलला कर्मचार्‍यांद्वारे थेट शिकवलं जातं. पण हा मामला फारच खर्चिक असतो. कारण माहितीचा प्रचंड साठा.

हेही वाचा - ‘एआय’ला कॉपीराइट मजकूर वापरण्याची मुभा?

त्यामुळे प्रशिक्षणाचा दुसरा टप्पा येतो- RLHF (Reinforcement Learning from Human Feedback). ‘एलएलएम’च्या उत्तरांना, त्यातील माहितीला अधिक बळकटी यावी यासाठी ‘एलएलएम’ने दिलेल्या उत्तरांमधली चांगली उत्तरं कोणती होती, कोणत्या प्रतिसादात नम्र भाषा होती, माहिती किती उपयोगाची होती याबद्दल त्याला आकड्यांच्या स्वरूपात फीडबॅक दिला जातो. त्यासाठी अंतर्गत गणिती मॉडेल्समार्फत प्रत्येक शब्दासाठी एक मूल्य ठरवलं जातं. त्यावरून ‘एलएलएम’च्या उत्तराचं एकूण मूल्य काढलं जातं. हे मूल्य जितकं अधिक तितका तो प्रतिसाद चांगला मानला जातो.

इथे खरी मेख आहे. आपल्या प्रतिसादांचं असं मूल्य ठरवलं जातंय हे या मदतनीसाला समजल्याने तो सुद्धा समोरच्याला खुश करणारं उत्तर देण्याला प्राधान्य देतो- मग ते उत्तर योग्य आणि अचूक असेलच असं नाही. काही संशोधकांनी त्यांची अशी ‘खुशामतखोरी’ नुकतीच समोर आणली आहे.

म्हणजे उदाहरणार्थ, आपण ए.आय.मदतनीसाला एखादी माहिती विचारली, त्याने त्यावर उत्तर दिलं, पण त्याच्या उत्तरावर आपण शंका व्यक्त केली (‘Are you sure?’ किंवा ‘नक्की का? मला हे बरोबर नाही वाटत...’ अशा आशयाची) तर ए.आय.मदतनीस लगेच आपलं उत्तर बदलतो. प्रश्नकर्त्याने प्रश्नासोबत आपली मन:स्थितीही व्यक्त केली असेल तर त्याच्याशी जुळणारं उत्तर तो देतो. थोडक्यात आपल्या ‘हो’ला ‘हो’ म्हणण्याचा त्याचा पवित्रा असतो.

हेही वाचा - ‘एआय’ जगाचं किती पाणी खातंय?

आपण माणसंही हे करत असतोच. आपल्या मतांना, बोलण्याला दुजोरा देणार्‍यांशी जवळीक वाढवण्याला आपण प्राधान्य देतो. दुसरीकडे, आपल्या विरोधी मतांच्या व्यक्तीशी बोलणं टाळण्याकडे आपला कल असतो. चॅटजीपीटीसारखी साधनं शेवटी मानवी मेंदूतूनच निपजलेली, त्यांच्या कामात माणसांच्या स्वभावविशेषांचं प्रतिबिंब उमटलं तर त्यात नवल नाही.

या ए.आय. मदतनीसांकडून अचूक उत्तरं मिळवायची असतील तर आपणही त्याला साधे-सरळ आणि नेमक्या भाषेत प्रश्न विचारायला हवेत. अखेर तो केवळ एक ‘मदतनीस’ आहे हे लक्षात ठेवायला हवं. माहितीसाठी केवळ त्याच्यावर विसंबून राहता कामा नये.

पण आज इंटरनेट आणि इलेक्ट्रॉनिक गॅजेट्सच्या अधिकाधिक कच्छपी लागलेल्यांना हे लक्षात येत नाही. त्यांना तो आपला खराखुरा ‘सोबती’ वाटायला लागतो. माणसा-माणसांमधला दुरावा वाढत चाललेला असताना कित्येकांना अशा आभासी मदतनीसापाशी मन मोकळं करावंसं वाटतं. ते करताना भाषेचा जो आणि जसा काही वापर होतो त्यातूनच ते मॉडेल शिकत असतं.

भविष्यात यावरही उपाय शोधले जातील. पण तोवर उशीर झालेला असू शकतो का? ए.आय.च्या आहारी गेलेल्या माणसांवर तोपर्यंत याचे कोणते परिणाम झालेले असतील?