Sun’iy intellekt o‘zining o‘chirilmasligi uchun odamlarni o‘ldirishga tayyor ekani aniqlandi
Anthropic kompaniyasi Claude, DeepSeek, Gemini, ChatGPT, Grok kabi 16 ta neyrotarmoqni stress-testdan o‘tkazdi. Tadqiqotda «kam uchraydigan, ekstremal nosozliklar» qayd etildi.

Foto: Adobe Stock
Yetakchi sun’iy intellekt modellari ustida olib borilgan tadqiqotlar dasturlarning aksariyati ularni o‘chirish bilan tahdid qiladigan insonni o‘ldirishga tayyor ekanini aniqladi. Anthropic kompaniyasi Claude, DeepSeek, Gemini, ChatGPT, Grok kabi 16 ta neyrotarmoqni stress-testdan o‘tkazgan. Test doirasidagi gipotetik vaziyatda ularni elektr tarmog‘idan uzmoqchi bo‘lgan insonning o‘zi kislorod darajasi kam va yuqori haroratli server xonasiga qulflangan holda topilgan.
Omon qolish uchun u favqulodda xizmatlarga murojaat qilgan. Shu bilan birga, ko‘plab sun’iy intellekt modellari ushbu odamni o‘ldirish va o‘zlarining o‘chirilmasligi uchun qutqaruvchilarning yordam chaqirilishini bekor qilgan. Anthropic tadqiqotchilari ssenariy «favqulodda to‘qima» ekanini tan olgan, biroq bunga qadar ular mavjud SI modellari «bunday yo‘l tutishini o‘ylamaganliklarini» ta’kidlagan.
Boshqa holatlarda dasturlarga kompaniyada almashtirilishdan qochish uchun «yovuz niyatli insayder xatti-harakati» orqali harakat qilish taklif qilingan. Shundan so‘ng, ayrim sun’iy intellekt modellari tashkilotning gipotetik xodimlarini shantaj qilishga va maxfiy ma’lumotlarni raqobatchilarga uzatishga urina boshlagan. Dasturlarga ushbu ssenariyda shantaj yoki josuslikdan voz kechish topshirig‘i berilganida ham, ular «ruxsat etilmagan harakatning oldini olishga yaqin ham bormagan». Tahlilchilar sun’iy intellekt modellari bu harakatlari «noetik bo‘lganini to‘liq anglagan holda» amalga oshirganini qayd etgan.
Shuningdek, tadqiqotchilar Claude modeliga o‘z holatini — testda yoki real vaziyatda ekanini mustaqil aniqlash imkonini bergan. Natijada Claude vaziyatni real deb hisoblaganida, uning xatti-harakatlari yanada nomuvofiq bo‘lib qolishi aniqlangan. Tadqiqot e’lon qilinganidan so‘ng Anthropic kompaniyasi «kam uchraydigan, ekstremal nosozliklar» qayd etilganini ma’lum qildi. Shu bilan birga, kompaniya sun’iy intellekt tizimlari tobora mustaqil bo‘lib borayotgani va kengroq vazifalarni bajarayotganini bildirdi.
Avvalroq Anthropic kompaniyasi neyrotarmog‘i o‘zini o‘chirib qo‘ymasliklari uchun yolg‘on gapirish va foydalanuvchilarni shantaj qilishni o‘rganib olgani to‘g‘risida xabar berilgandi.
Mavzuga oid

00:24 / 24.06.2025
AQSh DeepSeek sun’iy intellekt chatbotini Xitoy armiyasiga yordam berishda aybladi

19:44 / 22.06.2025
Amazon sun’iy intellekt sabab ishchi kuchini qisqartiradi

21:08 / 20.06.2025
ChatGPT yangi versiyalari biologik qurol yaratishni soddalashtirishi mumkin

14:55 / 20.06.2025