Понедельник, 18 августа, 2025
27 C
Израиль

Anthropic вводит новую функцию для защиты моделей ИИ

Компания Anthropic объявила о внедрении новой функции для моделей своего чат-бота Claude, позволяющей прекращать экстремальные и редкие разговоры. Это нововведение поднимает важные вопросы о том, как мы взаимодействуем с системами искусственного интеллекта.

Согласно сообщению в блоге компании, новая функция предназначена для использования в случаях, когда пользователи продолжают вести вредное или оскорбительное поведение, несмотря на повторные попытки модели перенаправить разговор.

Удивительно, но компания подчеркивает, что данная мера направлена на защиту самой модели, а не пользователя. Anthropic признает, что пока не уверена в моральном статусе Claude и других больших языковых моделей, как в настоящее время, так и в будущем. Однако компания серьезно относится к этому вопросу и работает над выявлением и внедрением малозатратных интервенций для смягчения рисков для благополучия модели, если такое благополучие возможно.

Новая функция уже доступна для моделей Claude Opus 4 и 4.1.


📰 Источник: israelhayom.co.il
Адаптировано и переведено с оригинала

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Hot this week

Topics

Золото держит недельное падение на фоне опасений по поводу инфляции в США

Золото снижается на фоне опасений по инфляции и тарифов в США

Поражение Detroit Mercy на выезде против Michigan

Detroit Mercy проиграла выездной матч против Michigan со счетом 4-0.

Новая стратегия «Шуферсаль»: замена собственного бренда на премиальные товары

Шуферсаль меняет стратегию, заменяя собственный бренд на премиальные товары

Порт Ашдод приглашает стартапы для создания инновационных решений

Порт Ашдод запускает проект для стартапов с инновационными решениями

Кубок Италии: Дебют Модрича в Милане и сенсация от Палермо

Дебют Модрича в Милане и сенсация от Палермо в Кубке Италии.

Больше

Popular Categories