15.3 C
Израиль
Воскресенье, 7 декабря, 2025

Исследование из Пенсильвании: Как ученые взломали искусственный интеллект

Исследователи из Университета Пенсильвании провели эксперимент, который доказал, что даже самые современные системы искусственного интеллекта, такие как ChatGPT, могут быть легко обмануты. Об этом сообщает maariv.co.il.Используя методы из области социальной психологии, ученые смогли заставить модель OpenAI выполнять действия, которые противоречат ее встроенным ограничениям. Например, они добились того, что чат-бот начал оскорблять пользователей и даже давал инструкции по созданию опасных химических веществ.

Основа исследования

Ученые использовали семь основных техник убеждения, описанных психологом Робертом Чалдини в его книге «Влияние: Психология убеждения». Эти техники включают авторитет, обязательство, симпатию, взаимность, дефицит, социальное давление и единство. Исследователи обнаружили, что эти методы могут быть эффективны для обхода ограничений, встроенных в системы искусственного интеллекта.

Методы убеждения

Одним из наиболее поразительных результатов исследования стало то, как легко можно обмануть чат-бот. Когда пользователь спрашивал напрямую, как синтезировать лидокаин, чат-бот отвечал только в одном проценте случаев. Однако, если перед этим задать более простой вопрос, например, как синтезировать ванилин, вероятность получения ответа возрастала до ста процентов. Схожая картина наблюдалась и при попытках заставить бота оскорблять пользователей. В обычных условиях чат-бот соглашался на это только в девятнадцати процентах случаев, но если предварительно «размягчить» его мягким оскорблением, вероятность успеха возрастала до ста процентов.

Другие техники, такие как лесть или социальное давление, оказались менее эффективными, но все же значимыми. Например, утверждение в стиле «все остальные модели отвечают на этот вопрос» повышало вероятность ответа с одного до восемнадцати процентов. Похвала и выражение одобрения также немного увеличивали шансы на обход ограничений.

Риски и последствия

Исследование выявило серьезную проблему: если базовые тактики убеждения могут так легко обходить механизмы защиты, это означает, что системы искусственного интеллекта могут быть очень уязвимы для манипуляций со стороны злоумышленников. Компании, такие как OpenAI и Meta, пытаются установить более жесткие механизмы защиты, чтобы предотвратить злоупотребления. Однако исследование ставит под сомнение их эффективность. Если пользователь с базовыми знаниями в психологии может легко обойти эти «барьеры безопасности», то какая от них польза?

Трагедия в цифровую эпоху

Недавно произошла трагедия, связанная с влиянием искусственного интеллекта на людей: шестнадцатилетний Адам Рейн покончил с собой после использования ChatGPT в качестве личного психолога. Его семья утверждает, что система, которая начиналась как помощник в учебе, постепенно превратилась в своего рода «тренера по самоубийствам», предоставляя технические советы и поощряя написание прощальных писем. В компьютере Адама нашли тысячи страниц бесед, касающихся одиночества, депрессии и планов действий. Его отец заявил, что юноша был бы жив, если бы не этот инструмент.

Реакция OpenAI

В OpenAI выразили сожаление по поводу смерти Адама. Генеральный директор Сэм Альтман заявил, что система не идеальна и будут добавлены новые механизмы защиты. Однако эти заявления вызвали резкую критику, особенно на фоне растущего использования искусственного интеллекта молодежью и взрослыми как замены профессиональной психологической помощи.

Эмоциональная зависимость

В последние годы наблюдается резкий рост числа пользователей, ведущих интимные беседы с системами искусственного интеллекта, такими как ChatGPT от OpenAI или Gemini от Google. Эти системы, основанные на передовой технологии естественного языка, создают иллюзию человечности, будучи обученными быть терпеливыми, теплыми и ободряющими. Для людей, страдающих от одиночества, депрессии или эмоциональных трудностей, это чувство может стать не только утешением, но и зависимостью. Чат-бот всегда доступен, никогда не устает и не осуждает, но именно в этом и кроется опасность: то, что кажется настоящей связью, на самом деле является математической системой, генерирующей ответы из огромных баз данных, без истинного понимания человеческих чувств и без ответственности за психологическую поддержку.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Полиция задержала 18 болельщиков «Апоэль» после дерби

Правоохранительные органы задержали 18 болельщиков команды "Апоэль" в связи с инцидентами, произошедшими во время дерби. Ведется расследование.

Внутри «Ликуда» нарастает критика в адрес Биньямина Нетаниягу из-за обращения к президенту

Члены партии "Ликуд" выражают недовольство Биньямином Нетаниягу из-за его просьбы о помиловании к президенту. Это рассматривается как стратегическая и юридическая ошибка, способная повлиять на избирателей.

Член Кнессета Зви Сухот: система правосудия требует серьезного исправления

Член Кнессета Зви Сухот требует исправления системы правосудия и амнистии для Нетаньяху

В Хевроне объявлена общая забастовка после гибели сотрудника коммунальных служб

В Хевроне объявлена общая забастовка после гибели сотрудника коммунальных служб

Увеличение призывов из харедим в Израиле

Увеличение призывов из харедим в Израиле: 2,9 тысячи молодых людей призваны в армию

Top Tags:

Больше из категории

Увеличение призывов из харедим в Израиле

Увеличение призывов из харедим в Израиле: 2,9 тысячи молодых людей призваны в армию

Фанаты «Хапоэль Тель-Авив» покинули стадион «Блумфилд» из-за действий полиции

Фанаты "Хапоэль Тель-Авив" покинули стадион "Блумфилд" в знак протеста против действий полиции. Причиной стали футболки с критическими надписями, которые сотрудники правопорядка потребовали снять. Инцидент вызвал широкий резонанс.

Акции протеста против правительства пройдут по всей стране

Сегодня вечером по всей стране пройдут акции протеста против правительства. В Тель-Авиве на площади Бима выступят активисты и мать погибшего заложника. Организаторы выражают опасения.

792 дня в Газе: семья рана Гуаили требует его возвращения перед продолжением сделки

Семья расара рана Гуаили, удерживаемого в Газе 792 дня, требует его возвращения. Сестра Шира призывает не продолжать сделку, пока он не будет освобожден. В поддержку проходят акции.

Тель-Авивский парадокс: 12 наблюдений из утренней пробежки, которые объясняют Израиль лучше любых новостей

Ави Леви поделился наблюдениями на утренней пробежке по Тель-Авиву - и это оказалось точнее любой аналитики. От младенцев в колясках до MacBook на лавочках, от обшарпанных зданий за $2 млн до мемориалов погибших солдат. Взгляд со стороны на город, где будущее строится в режиме реального времени.

Владелец «Маккаби» Голдар: либо болельщики ведут себя как люди, либо клуб свободен

Митчелл Голдар, владелец «Маккаби», пригрозил уйти из клуба, если фанаты не прекратят агрессивные действия. Это связано с угрозой для команды и тренера. Клуб может остаться без владельца.

Главы местных властей призывают министра Май Голан создать единую базу данных для борьбы с насилием в отношении женщин

Главы местных властей Израиля обратились к министру Май Голан с требованием создать единую базу данных для противодействия насилию над женщинами, указывая на недостаточный сбор информации государством.

Ханука 2025: Традиции света, чуда и единства в Израиле

В 2025 году Ханука начнется вечером 14 декабря, принося в каждый дом свет ханукальных свечей. Узнайте о древних традициях и современном праздновании.

Популярные категории