Среда, 4 февраля, 2026

Исследование из Пенсильвании: Как ученые взломали искусственный интеллект

Исследователи из Университета Пенсильвании провели эксперимент, который доказал, что даже самые современные системы искусственного интеллекта, такие как ChatGPT, могут быть легко обмануты. Об этом сообщает maariv.co.il.Используя методы из области социальной психологии, ученые смогли заставить модель OpenAI выполнять действия, которые противоречат ее встроенным ограничениям. Например, они добились того, что чат-бот начал оскорблять пользователей и даже давал инструкции по созданию опасных химических веществ.

Основа исследования

Ученые использовали семь основных техник убеждения, описанных психологом Робертом Чалдини в его книге «Влияние: Психология убеждения». Эти техники включают авторитет, обязательство, симпатию, взаимность, дефицит, социальное давление и единство. Исследователи обнаружили, что эти методы могут быть эффективны для обхода ограничений, встроенных в системы искусственного интеллекта.

Методы убеждения

Одним из наиболее поразительных результатов исследования стало то, как легко можно обмануть чат-бот. Когда пользователь спрашивал напрямую, как синтезировать лидокаин, чат-бот отвечал только в одном проценте случаев. Однако, если перед этим задать более простой вопрос, например, как синтезировать ванилин, вероятность получения ответа возрастала до ста процентов. Схожая картина наблюдалась и при попытках заставить бота оскорблять пользователей. В обычных условиях чат-бот соглашался на это только в девятнадцати процентах случаев, но если предварительно «размягчить» его мягким оскорблением, вероятность успеха возрастала до ста процентов.

Другие техники, такие как лесть или социальное давление, оказались менее эффективными, но все же значимыми. Например, утверждение в стиле «все остальные модели отвечают на этот вопрос» повышало вероятность ответа с одного до восемнадцати процентов. Похвала и выражение одобрения также немного увеличивали шансы на обход ограничений.

Риски и последствия

Исследование выявило серьезную проблему: если базовые тактики убеждения могут так легко обходить механизмы защиты, это означает, что системы искусственного интеллекта могут быть очень уязвимы для манипуляций со стороны злоумышленников. Компании, такие как OpenAI и Meta, пытаются установить более жесткие механизмы защиты, чтобы предотвратить злоупотребления. Однако исследование ставит под сомнение их эффективность. Если пользователь с базовыми знаниями в психологии может легко обойти эти «барьеры безопасности», то какая от них польза?

Трагедия в цифровую эпоху

Недавно произошла трагедия, связанная с влиянием искусственного интеллекта на людей: шестнадцатилетний Адам Рейн покончил с собой после использования ChatGPT в качестве личного психолога. Его семья утверждает, что система, которая начиналась как помощник в учебе, постепенно превратилась в своего рода «тренера по самоубийствам», предоставляя технические советы и поощряя написание прощальных писем. В компьютере Адама нашли тысячи страниц бесед, касающихся одиночества, депрессии и планов действий. Его отец заявил, что юноша был бы жив, если бы не этот инструмент.

Реакция OpenAI

В OpenAI выразили сожаление по поводу смерти Адама. Генеральный директор Сэм Альтман заявил, что система не идеальна и будут добавлены новые механизмы защиты. Однако эти заявления вызвали резкую критику, особенно на фоне растущего использования искусственного интеллекта молодежью и взрослыми как замены профессиональной психологической помощи.

Эмоциональная зависимость

В последние годы наблюдается резкий рост числа пользователей, ведущих интимные беседы с системами искусственного интеллекта, такими как ChatGPT от OpenAI или Gemini от Google. Эти системы, основанные на передовой технологии естественного языка, создают иллюзию человечности, будучи обученными быть терпеливыми, теплыми и ободряющими. Для людей, страдающих от одиночества, депрессии или эмоциональных трудностей, это чувство может стать не только утешением, но и зависимостью. Чат-бот всегда доступен, никогда не устает и не осуждает, но именно в этом и кроется опасность: то, что кажется настоящей связью, на самом деле является математической системой, генерирующей ответы из огромных баз данных, без истинного понимания человеческих чувств и без ответственности за психологическую поддержку.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Тройное убийство в Бейт-Берль: месть за кровь (видео)

В Бейт-Берле трое мужчин получили огнестрельные ранения и скончались в больнице. Полиция считает причиной месть за давний конфликт.

ЦАХАЛ расчищает границу: ЮНИФИЛ обвиняет в нарушении резолюции 1701

ЦАХАЛ начал операцию в Южном Ливане, расчищая границу от растительности. ЮНИФИЛ обвиняет Израиль в нарушении резолюции 1701 ООН.

Закон о здравоохранении разделили из-за клиники в Нетивоте

Закон о здравоохранении будет рассмотрен отдельно от пакета законов из-за споров о новой клинике в Нетивоте. Это может ускорить его принятие.

Масштабная партия оружия изъята в Восточном Иерусалиме

Полиция Израиля провела операцию по изъятию оружия в Восточном Иерусалиме. Обнаружен крупный арсенал, включая автоматы и пистолеты. Цель — предотвращение терактов и защита граждан.

Февраль в Израиле: вместо снега — цветы и лёгкий дождь

Синоптики обещают лишь туман и кратковременные теплые дожди, а в субботу — локальный ливень на северной границе.

Top Tags:

Больше из категории

Февраль в Израиле: вместо снега — цветы и лёгкий дождь

Синоптики обещают лишь туман и кратковременные теплые дожди, а в субботу — локальный ливень на северной границе.

Долгожданный дождь накроет Израиль: прогноз по часам

Сегодня в полночь начнётся обильный дождь в Галилее, к утру он доберётся до Тель-Авива и Иерусалима. Метеорологи обещают подъём уровня Кинерета и наполнение пересыхающих рек.

БАГАЦ потребовал объяснить закрытие Галеи ЦАХАЛ

Суд обязал правительство до 15 марта обосновать решение закрыть армейскую радиостанцию, иначе оно может быть отменено.

Тысячи требуют возобновить репатриацию из Эфиопии: «Правительство игнорирует»

Тысячи требуют возобновить репатриацию из Эфиопии. Протестующие у Кнессета настаивают на выделении бюджета для алии, обвиняя правительство в игнорировании тысяч ожидающих.

Кирьят-Шмона: обещания восстановления, но жители не верят

Жители Кирьят-Шмоны скептически относятся к обещаниям властей о восстановлении города. После месяцев обстрелов и разрушений, люди требуют реальных действий, а не пустых слов.

Крановщики объявляют забастовку: требуют безопасности и достойной оплаты

Крановщики объявили забастовку, требуя улучшения условий труда, безопасности и пересмотра оплаты. Профсоюз настаивает на соблюдении норм, подрядчики заявляют о компромиссах.

Озеленение Беэр-Шевы: как одна женщина удвоит число деревьев в пустыне

Амбициозный проект Сигал Хадар по озеленению Беэр-Шевы направлен на удвоение числа деревьев за 15 лет. Цель – создание тени и комфортной городской среды.

Зимняя жара бьет рекорды: 25 градусов в Беэр-Шеве

Аномальная зимняя жара в Израиле достигла пика. В Беэр-Шеве и Тель-Авиве ожидается до 25 градусов. Синоптики отмечают нетипичность таких температур для февраля.

Популярные категории