OpenAI анонсировала обновление ChatGPT Images 2.0, которое теперь поддерживает мультиязычный текст и точное следование сложным инструкциям . Новая версия поднялась на первую строчку рейтинга LM Arena, опередив ближайших конкурентов на 242 балла Elo благодаря идеальному рендерингу текста на разных языках. Vercel Labs представили zero-code язык программирования Zero, позиционируя его как инструмент для агентов. Несмотря на громкое заявление, разработчики отметили ряд недостатков, указывая на отсутствие привычной структуры и синтаксиса . McKinsey исследовали влияние автоматизации на европейский рынок труда и пришли к выводу, что уже сейчас возможно автоматизировать 58% рабочих часов. Анализ выявил три новых архетипа профессий: профессии с человеком в центре, совместная работа с агентами и роботами, а также роли, управляемые алгоритмами . Исследование показало, что современные ИИ-агенты способны решить лишь небольшую долю реальных задач. Например, на новом бенчмарке ClawBench лучшая модель смогла справиться только с 33% повседневных задач интернета , а на другом тесте Remote Labor Index лидеры выполнили менее 2.5% реальных заказов с бирж фриланса .
Источники
- ChatGPT Images 2.0: OpenAI запустила обновление модели генерации изображений с рассуждениям, 2K-разрешением и мультиязычным текстом — neurohive.io
- Zero — новый agent-first язык программирования от Vercel, который изменит все (нет) — habr.com
- Агенты, роботы и мы: как ИИ перекраивает рынок труда в Европе — habr.com
- ClawBench: лучший ИИ-агент смог успешно завершить только 33% реальных повседневных задач — neurohive.io
- Remote Labor Index: ведущие ИИ-агенты справились с 2.5% реальных задач с биржи фрилансеров — neurohive.io