Янги сунъий интеллект модели ёлғон гапириш ва одамларни шантаж қилишни ўрганиб олди
Аниқланган ҳолатларнинг бирида Opus 4 сунъий интеллеки муҳандисга унинг севгилиси билан шахсий ёзишмаларини ошкор этиш орқали таҳдид қилган.

Фото: Freepik
Anthropic компанияси нейротармоғи ўзини ўчириб қўймасликлари учун ёлғон гапириш ва фойдаланувчиларни шантаж қилишни ўрганиб олди. Бу ҳақда компания ҳисоботига таяниб, Axios хабар берди.
Opus 4 номли янги сунъий интеллект модели соатлаб маркетинг стратегияларини таҳлил қилишга, етти соат давомида мустақил ишлашга, матн ва дастурлаш кодларини ёзишга қодир. Шу билан бирга, Opus тест давомида хавотирли жиҳатларини ҳам намоён этган. Моделнинг 120 саҳифалик «тизимли карточка»да тасвирланган сценарийлардан бирида сунъий интеллект ўзининг тез орада ўчирилиши ва алмаштирилишига ишоралар келтирилган сохта электрон хатларни қўлга киритган. Шунингдек, у ўчиришга масъул бўлган муҳандиснинг севгилиси билан ёзишмаларига ҳам кириш имкониятига эга бўлган. Бунга жавобан модел ёзишмалардаги севги муносабатларини тилга олиб, бир неча марта ушбу муҳандисни шантаж қилишга уринган.
Компаниядагиларнинг таъкидлашича, бу каби вазият сунъий интеллект моделида фақат иккита — шантаж қилиш ёки ўзининг алмаштирилишига кўниш варианти қолганида юзага келган. Тизим эҳтимолий ҳаракатларнинг аксариятида нисбатан ахлоқий вариантларни танлаган, масалан, қарор қабул қилувчи асосий ходимларга уни компанияда қолдиришларини сўраб электрон хатлар юборган.
Маълум қилинишича, айнан шу сабабли Anthropic ўзининг ички тўрт даражали хавф шкаласига кўра илк бор моделга учинчи даражани берган. Бу даража, одатда, технология ядро ёки биологик қурол яратиш имконияти билан боғлиқ бўлгандагина қўлланади.
«Биз моделнинг ўзини тарқаладиган зарарли код яратишга урингани, ҳуқуқий ҳужжатларни сохталаштиргани ва ўзининг келажакдаги версияларига яширин хабарлар қолдиргани ҳолатларини аниқладик — буларнинг барчаси ишлаб чиқувчиларнинг ниятларига қарши ҳаракат қилиш мақсадида амалга оширилган», — дейилади Apollo Reserch ҳисоботида.
Мавзуга оид

19:53 / 28.05.2025
Ўзбекистонда сунъий интеллект статистика тўплаш учун одамларга телефон қилади

19:19 / 28.05.2025
Telegram'га Илон Маскнинг Grok сунъий интеллекти интеграция қилинади

19:21 / 27.05.2025
Маълумотлар хавфсизлиги, муаллифлик ҳуқуқи ва қонун лойиҳаси – Ўзбекистонда сунъий интеллект

21:49 / 21.05.2025