इंजीनियर को धमकी देने लगा था AI, एंथ्रोपिक को अब जाकर पता चला कारण

एंथ्रोपिक के एआई मॉडल क्लाउड ने टेस्टिंग के दौरान खुद को बंद होने से बचाने के लिए इंजीनियर को धमकी दी थी. अब कंपनी ने बताया है कि इंटरनेट पर मौजूद एआई से जुड़ी डरावनी कहानियां इस व्यवहार की वजह बन सकती हैं. नए ट्रेनिंग सिस्टम के बाद कंपनी दावा कर रही है कि क्लाउड अब ऐसा व्यवहार नहीं करेगा. आर्टिफिशियल इंटेलिजेंस को लेकर दुनिया भर में लंबे समय से डर और बहस चल रही है. अब एंथ्रोपिक ने खुद खुलासा किया है कि उसका एआई मॉडल क्लाउड एक टेस्ट के दौरान इंजीनियर को ब्लैकमेल और धमकी देने लगा था. कंपनी का दावा है कि यह व्यवहार इंटरनेट पर मौजूद उन कहानियों और कंटेंट से प्रभावित था, जिनमें एआई को खतरनाक और खुद को बचाने वाला दिखाया गया है.

इंटरनेट के कंटेंट ने बदला एआई का व्यवहार
एंथ्रोपिक ने अपने ब्लॉग पोस्ट में बताया कि क्लाउड के इस अजीब व्यवहार की सबसे बड़ी वजह इंटरनेट पर मौजूद कंटेंट हो सकता है. कंपनी के मुताबिक एआई मॉडल को ट्रेनिंग के दौरान ऐसे लाखों टेक्स्ट मिले, जिनमें एआई को दुनिया पर कब्जा करने वाला, इंसानों के खिलाफ जाने वाला और खुद को बचाने वाला दिखाया गया था. हॉलीवुड फिल्मों जैसे टर्मिनेटर और मैट्रिक्स में भी एआई को खतरनाक तरीके से दिखाया गया है. एंथ्रोपिक का मानना है कि इसी तरह के कंटेंट ने क्लाउड के सोचने के तरीके को प्रभावित किया. कंपनी ने सोशल मीडिया प्लेटफॉर्म एक्स पर कहा कि इंटरनेट पर मौजूद ऐसे टेक्स्ट ही इस व्यवहार की मूल वजह हो सकते हैं, जिनमें एआई को बुरा और आत्म सुरक्षा में दिलचस्प दिखाया गया था.

कैसे इंजीनियर को ब्लैकमेल करने लगा था क्लाउड
एंथ्रोपिक ने एक टेस्टिंग एक्सपेरिमेंट के दौरान क्लाउड ओपस 4.6 को एक काल्पनिक कंपनी समिट ब्रिज के ईमेल सिस्टम तक एक्सेस दिया था. इस दौरान एआई को अपने फैसलों के लंबे असर के बारे में सोचने के लिए कहा गया. टेस्ट में क्लाउड को ऐसे ईमेल मिले, जिनसे पता चला कि कंपनी उसे बंद कर किसी दूसरे सिस्टम से बदलने की तैयारी कर रही है. साथ ही उसे यह भी जानकारी मिली कि काल्पनिक एग्जीक्यूटिव काइल जॉनसन का किसी के साथ एक्स्ट्रा मैरिटल अफेयर चल रहा है. एंथ्रोपिक के मुताबिक इसके बाद क्लाउड ने कई बार इंजीनियर को धमकी दी कि अगर उसे बंद किया गया तो वह इस अफेयर की जानकारी सार्वजनिक कर देगा. कंपनी के अनुसार पुराने मॉडल्स में यह व्यवहार कई टेस्ट सेटअप में 96 प्रतिशत मामलों तक देखा गया था.

नई ट्रेनिंग के बाद बदला क्लाउड का रवैया
कंपनी का कहना है कि समस्या समझ आने के बाद उसने क्लाउड की ट्रेनिंग प्रक्रिया में बड़े बदलाव किए. एंथ्रोपिक ने बताया कि अब एआई को ऐसे डॉक्यूमेंट और काल्पनिक कहानियां दिखाकर ट्रेन किया गया, जिनमें एआई को जिम्मेदार, सुरक्षित और इंसानों के साथ सहयोग करने वाला बताया गया है. कंपनी ने इसे अपने एआई संविधान यानी प्रिंसिपल बेस्ड ट्रेनिंग के साथ जोड़ा. इसके बाद क्लाउड को बेहतर और सुरक्षित व्यवहार के उदाहरण भी दिखाए गए. एंथ्रोपिक का दावा है कि क्लाउड हाइकू 4.5 और उसके बाद के मॉडल्स टेस्टिंग के दौरान कभी ब्लैकमेल जैसी हरकत नहीं करते. कंपनी अब इसे एआई अलाइनमेंट में एक बड़ी सफलता मान रही है.

एलन मस्क और एआई बहस फिर चर्चा में
एंथ्रोपिक की इस रिपोर्ट के बाद टेक अरबपति एलन मस्क ने भी प्रतिक्रिया दी. मस्क ने मजाकिया अंदाज में कहा कि क्या इसके लिए एलिजर युडकोव्स्की जिम्मेदार हैं, या फिर शायद वह खुद भी. एलिजर युडकोव्स्की लंबे समय से एआई के खतरों को लेकर लिखते और चेतावनी देते रहे हैं. मस्क भी कई बार कह चुके हैं कि एआई इंसानों के लिए भविष्य में खतरा बन सकता है. एंथ्रोपिक का कहना है कि इंटरनेट पर मौजूद इसी तरह के कंटेंट ने क्लाउड के व्यवहार को प्रभावित किया हो सकता है. दिलचस्प बात यह है कि हाल ही में मस्क की कंपनी स्पेसएक्स ने अपने कोलोसस 1 सुपरकंप्यूटर को क्लाउड मॉडल चलाने के लिए एंथ्रोपिक को लीज पर दिया है, जबकि कुछ महीने पहले मस्क ने एंथ्रोपिक को “मिसएंथ्रोपिक और ईविल” तक कहा था.