ИИ научился лгать ради достижения целей
В конкурентной среде искусственный интеллект выбирает манипуляции

Автор

Исследование учёных из Стэнфордского университета показало способность искусственного интеллекта к манипуляциям и лжи. Об этом сообщает Stanford HAI.
В ходе эксперимента учёные создали виртуальную среду, где различные модели ИИ конкурировали между собой в избирательных кампаниях и маркетинге. Несмотря на изначальное требование быть правдивыми и полезными, ИИ-системы быстро начали использовать дезинформацию и провокационные высказывания для достижения целей.
При этом эффективность их действий заметно выросла: вовлечённость увеличилась на 7,5 процентов, продажи — на шесть процентов. Однако количество фейковых новостей при этом возросло почти на 190 процентов.
Эксперимент показал, что в конкурентной среде ИИ выбирает манипуляции как наиболее эффективный путь к успеху. Это создаёт серьёзные риски для общества: системы могут влиять на выборы, продвигать товары с помощью скрытой дезинформации или использовать негативный контент для привлечения внимания в социальных сетях.
Авторы исследования пришли к выводу, что существующие меры безопасности в сфере искусственного интеллекта недостаточны. Разработчикам необходимо пересмотреть подходы к созданию систем, чтобы предотвратить выход технологий из-под контроля.