OpenAI представила ChatGPT Images 2.0 с улучшенным качеством и разрешением
OpenAI официально объявила о запуске новой версии генератора изображений ChatGPT Images 2.0. Она основана на архитектуре gpt-image-2 и лидирует по качеству визуализации текста на множестве языков. Улучшения включают поддержку сложных инструкций, высокое разрешение до 2К и способность следовать детализированным подсказкам. После релиза модель стала первой по всем категориям генерации изображений согласно рейтингу LM Arena, обогнав конкурентов на 242 балла Elo.
Источник: neurohive.io
Новый бенчмарк ClawBench: лучшие ИИ-агенты завершают лишь треть реальных задач
Исследовательская группа представила ClawBench — уникальный набор тестов для проверки способности ИИ-агентов решать реальные повседневные задачи онлайн. Лучшая модель, Claude Sonnet 4.6, смогла справиться только с 33% заданий вроде бронирования рейса или оформления заказа. Этот результат значительно уступает показателям стандартных бенчмарков, где ИИ достигает 65–75%.
Источник: neurohive.io
Агентский Gemini от Google: новые мультимодальные модели и личный помощник
На конференции Google I/O 2026 компания презентовала новую линейку мультимодальных моделей серии Gemini. Ключевые новинки: Gemini Omni, принимающая любые форматы ввода и генерирующая видео, а также персональный ассистент Gemini Spark, призванный заменить обычные чаты с ботами. Дополнительно представлены восьмые поколения процессоров TPU для тренировки и инференса моделей.
Источник: ai-stat.ru
Anthropic предсказал рост ВВП на фоне увеличения безработицы
Дарио Амодей, генеральный директор Anthropic, заявил на Всемирном экономическом форуме, что развитие ИИ приведёт к росту мирового ВВП на 5–10%, однако одновременно вызовет всплеск безработицы до 10%. Такое сочетание показателей ранее наблюдалось крайне редко. Амодей назвал этот сценарий «кошмарным» и подчеркнул необходимость подготовки общества к таким изменениям.
Источник: ai-stat.ru
GLM-5: первая открытая модель, соперничающая с GPT и Claude
Китайская лаборатория Zhipu AI совместно с университетом Цинхуа представили GLM-5 — открытую языковую модель, занявшую первые места в ряде авторитетных бенчмарков. Среди достижений — победа в кодировании и генерации текста на платформе LMArena, лидерство на BrowseComp и HLE с использованием инструментов. GLM-5 способна не только отвечать на запросы, но и самостоятельно формулировать инструкции.
Источник: neurohive.io
ИИ-агенты выполнили менее 3% реальных рабочих задач фрилансеров
Команда Центра безопасности ИИ и Scale AI провела исследование Remote Labor Index, которое показало, что современные ИИ-агенты способны качественно выполнить лишь около 2.5% реальных заказов с платформы Upwork. Тестировались проекты различных категорий, от разработки игр до архитектурных чертежей. Исследование подчёркивает ограниченность текущих возможностей ИИ в реальной рабочей среде.
Источник: neurohive.io
Google столкнулась с проблемами поиска после обновления AI
Google сообщила о сбоях в поиске после недавнего обновления системы. Запросы типа «disregard» приводят к странным результатам: вместо ожидаемых результатов пользователи видят сообщения от виртуального помощника, будто он общается с человеком («Got it!»). Проблема связана с интеграцией новых технологий обработки естественного языка и требует доработки.
Источник: theverge.com
Zero — новый язык программирования для агентов от Vercel
Vercel Labs выпустили экспериментальный язык программирования Zero, ориентированный на использование искусственными агентами. Несмотря на амбициозную концепцию, реализация вызывает сомнения. Реальный код демонстрирует примитивность синтаксиса и отсутствие привычных конструкций, используемых программистами-человеками. Пока неясно, сможет ли Zero действительно упростить разработку приложений для агентов.
Источник: habr.com