Поддержать команду Зеркала
Беларусы на войне
  1. К осени Россия сможет регулярно использовать более 1000 дронов в одном ударном пакете — ISW
  2. «Должна наступить деэскалация». Поговорили с сестрой Колесниковой Татьяной об освобождении политзаключенных и несогласии с Тихановской
  3. Экс-кандидатка на президентских выборах 2025 года Анна Канопацкая опубликовала в Facebook фото на границе с Литвой
  4. «Какой-то ребенок, трус, рассылал через телеграм-канал — давайте по воскресеньям выходить». Тихановский — о протестах 2020 года
  5. Сколько денег прошло через клуб, который продвигает Карпенков
  6. «Всплыли» новые подробности о сбое в работе трех крупных банков, из-за чего у их клиентов «испарялись» деньги со счетов
  7. «Скупое меню для энергичного человека». Чем дальше будет заниматься Тихановский — мнение
  8. «Будешь сидеть, и будут тебе кол в задницу вгонять — тогда-то ты и попомнишь». Кто привел Лукашенко к власти и как сложилась их жизнь
  9. Темпы наступления России, вероятно, замедлятся осенью: аналитики — о перспективах войны
  10. Минск залило дождем и засыпало градом. В городе — пробки, трамваи стоят, некоторые улицы затопило
  11. В сети написали, что российская ПВО обстреляла пассажирский самолет из Минска, приняв за украинский дрон. Что известно
  12. Вице-премьер отправилась к абитуриентам с сумочкой за 1461 рубль. Рассказываем
  13. «Выматерился и закурил». Поговорили с беларусами — они видели и слышали российские дроны, летевшие через нашу страну для атаки Украины
  14. «Альфа-Банк» ввел новшество при обмене долларов и евро
  15. Возможно, вы не знали, но из-за оплаты товаров через кассы самообслуживания можно заработать «административку». Есть наглядный пример


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.