Security: शोधकर्ताओं ने एक जनरेटिव एआई कृमि विकसित करने के लिए “विरोधी स्व-नकल करने वाले संकेत” का इस्तेमाल किया।
शोधकर्ताओं ने यह भी कृत्रिम बुद्धिमत्ता प्रणाली के भीतर “खराब आर्किटेक्चर डिजाइन” के बारे में चेतावनी दी।
वायर्ड की एक रिपोर्ट के अनुसार, जैसे-जैसे ओपनएआई का चैटजीपीटी और गूगल का जेमिनी जैसे जनरेटिव एआई सिस्टम अधिक उन्नत होते जा रहे हैं, वैसे ही शोधकर्ता अब ऐसे एआई कृमि विकसित कर रहे हैं जो आपके गोपनीय डेटा को चुरा सकते हैं और जनरेटिव एआई सिस्टम के सुरक्षा उपायों को तोड़ सकते हैं।
कॉर्नेल विश्वविद्यालय, टेक्nion-इज़राइल इंस्टीट्यूट ऑफ टेक्नोलॉजी और इंटुइट के शोधकर्ताओं ने ‘मॉरिस II’ नाम का पहला जनरेटिव एआई कृमि बनाया, जो डेटा चुरा सकता है या मैलवेयर तैनात कर सकता है और एक सिस्टम से दूसरे सिस्टम में फैल सकता है। इसका नाम 1988 में इंटरनेट पर लॉन्च किए गए पहले कृमि के नाम पर रखा गया है। कॉर्नेल टेक के शोधकर्ता बेन नसी ने कहा, ” इसका मूल रूप से मतलब है कि अब आपके पास एक नए तरह का साइबर हमला करने या करने की क्षमता है जो पहले नहीं देखा गया है।”
आउटलेट के अनुसार, एआई कृमि चैटजीपीटी और जेमिनी में कुछ सुरक्षा उपायों को तोड़ सकता है, जो ईमेल डेटा चोरी करने और स्पैम भेजने के इरादे से एक जनरेटिव एआई ईमेल सहायक पर हमला करता है।
शोधकर्ताओं ने जनरेटिव एआई कृमि को विकसित करने के लिए “विरोधी स्व-नकल करने वाले संकेत” का इस्तेमाल किया। उनके अनुसार, यह संकेत जनरेटिव एआई मॉडल को प्रतिक्रिया में एक अलग संकेत उत्पन्न करने का कारण बनता है। इसे निष्पादित करने के लिए, शोधकर्ताओं ने तब एक ईमेल प्रणाली बनाई जो जनरेटिव एआई का उपयोग करके संदेश भेज और प्राप्त कर सके, चैटजीपीटी, जेमिनी और ओपन-सोर्स एलएलएम में जोड़ सके। इसके अलावा, उन्होंने सिस्टम का उपयोग करने के दो तरीकों की खोज की – टेक्स्ट-आधारित स्व-नकल करने वाले संकेत का उपयोग करके और छवि फ़ाइल के भीतर प्रश्न को एम्बेड करके।
एक मामले में, शोधकर्ताओं ने हमलावरों की भूमिका निभाई और एक विरोधी पाठ संकेत के साथ एक ईमेल भेजा। यह पुनर्प्राप्ति-संवर्धित पीढ़ी का उपयोग करके ईमेल सहायक के डेटाबेस को “जहर” देता है, जो एलएलएम को अपने सिस्टम के बाहर से अधिक डेटा प्राप्त करने की अनुमति देता है। श्री नसी के अनुसार, पुनर्प्राप्ति-संवर्धित पीढ़ी “जेनएआई सेवा को जेलब्रेक” करती है, जब वह उपयोगकर्ता पूछताछ के जवाब में एक ईमेल प्राप्त करती है और जवाब उत्पन्न करने के लिए इसे GPT-4 या जेमिनी प्रो को भेजती है। इसके अंत में ईमेल से डेटा चोरी हो जाता है।
दूसरी विधि के लिए, शोधकर्ता ने बताया, “स्व-नकल करने वाले संकेत को छवि में एन्कोड करके, स्पैम, दुर्व्यवहार सामग्री, या यहां तक कि प्रचार वाली किसी भी तरह की छवि को प्रारंभिक ईमेल भेजे जाने के बाद नए ग्राहकों को अग्रेषित किया जा सकता है।”
अपने निष्कर्षों का प्रदर्शन करने वाला एक वीडियो ईमेल सिस्टम को बार-बार एक संदेश अग्रेषित करते हुए दिखाता है। शोधकर्ताओं का दावा है कि वे ईमेल डेटा भी प्राप्त कर सकते हैं।