Поддержать команду Зеркала
Беларусы на войне
  1. Силовики задержали сотрудницу Минздрава
  2. По указанию «сверху»: для чего Кремль позволяет и как использует агрессивные высказывания Дмитрия Медведева в адрес мировых лидеров
  3. В отношении лидера группы «Палац» Олега Хоменко завели уголовное дело
  4. «Самые грузные сотрудники расположились на канализационных люках». Как охраняли райцентр во время приезда Лукашенко
  5. «Зеркало» отмечает четвертый день рождения — и это печальная новость. Вот почему
  6. Воскресенский рассказал, как комиссия голосовала по вопросу освобождения Тихановского
  7. Общался с Лукашенко и был «главным госпоэтом», но выбрал оппозицию и эмиграцию. Сегодня ему 79 — рассказываем, что изменило его жизнь
  8. «Стараются задержать всех, кто засветился». Силовики получили приказ активнее задерживать участников протестов 2020-го — BELPOL
  9. Еще у одного политзаключенного, похоже, «отжали» недвижимость. Нашлись желающие купить — они устроили «драку»
  10. Скандал в Минском колледже искусств: бывший студент обвинил преподавателя в сексуализированном насилии. Тот все отрицает
  11. «Вясна»: Силовики активно задерживают беларусов, попавших в кадры документального фильма о протестах
  12. На интервью с Тихановской пришли липовые российские журналисты. Обман раскрыли в самый последний момент
  13. Заканчивается срок давности по «народной» статье за участие в протестах 2020-го. Спросили у юристки, можно ли больше не бояться силовиков
  14. «Человеку хочется прикоснуться к миру люкса». Как одевается личный врач Лукашенко
  15. Почему заявления Тихановского многих возмущают? Мнение
  16. Юг зальет, на севере намечается нечто еще более интересное. На Беларусь движется мощный циклон — объявлен оранжевый уровень опасности


/

Исследователи из Университета Карнеги-Меллон провели эксперимент, в котором создали виртуальную IT-компанию с сотрудниками-роботами. Даже лучший ИИ-работник смог выполнить только четверть поставленных задач, а остальные показали еще более плачевные результаты, пишет издание Futurism.

Изображение: Pexels
Робот. Снимок носит иллюстративный характер. Фото: Pexels.com

Исследователи создали виртуальную компанию под названием TheAgentCompany, где все позиции — от финансовых аналитиков и программистов до проектных менеджеров — занимали не люди, а ИИ-агенты от Google, OpenAI, Anthropic и Meta. Агент — это модель искусственного интеллекта, которая должна самостоятельно выполнять поставленные задачи, подобно человеку.

Виртуальным сотрудникам поручили обычные офисные задания: работать с файлами, совершать виртуальные экскурсии по новым офисным помещениям и писать отзывы на работу коллег.

Результаты оказались катастрофическими. Лучшей моделью стала Claude 3.5 Sonnet от компании Anthropic, но даже она смогла выполнить лишь 24% поставленных задач. При этом ее работа была крайне неэффективной — в среднем на каждую задачу уходило около 30 шагов и более шести долларов.

Gemini 2.0 Flash от Google тратил на каждую задачу около 40 шагов, но успешно завершал только 11,4% заданий. Худшим «сотрудником» оказался Nova Pro v1 от Amazon, который справился лишь с 1,7% поручений.

Исследователи отметили, что цифровым работникам не хватает здравого смысла, социальных навыков и понимания того, как работать в интернете. ИИ-сотрудники часто придумывали нелепые решения проблем — например, когда один робот не смог найти нужного человека в корпоративном чате, он просто переименовал другого пользователя.

Хотя современные ИИ-модели могут неплохо справляться с некоторыми простыми задачами, итоги этого и других исследований показывают, что они пока не готовы к более сложной работе, с которой легко справляются люди. Во многом это связано с тем, что нынешний «искусственный интеллект» — это, по сути, продвинутая версия предиктивного ввода текста в вашем телефоне, а не разумное существо, способное решать проблемы, учиться на опыте и применять его в новых ситуациях, отмечают авторы.