Новый уровень генерации изображений: ChatGPT Images 2.0 от OpenAI
OpenAI выпустила ChatGPT Images 2.0 на базе модели gpt-image-2. Новая версия лидирует во всех категориях генерации изображений, опережая конкурентов на 242 балла Elo благодаря качественному рендерингу текста на нескольких языках и следованию сложным инструкциям.
Источник: neurohive.io
Топ-1 открытая модель GLM-5 превзошла Claude и GPT на агентных задачах
Zhipu AI и Tsinghua University представили GLM-5 — первую открытую языковую модель, занявшую первые места на бенчмарках Artificial Analysis, LMArena, BrowseComp и HLE с инструментами. Она способна не только отвечать на запросы, но и самостоятельно решать комплексные задачи.
Источник: neurohive.io
Mozilla обновляет Firefox: управление ИИ и выбор местоположения VPN
Mozilla выпустила новую версию Firefox с возможностью выбора местоположения встроенного VPN и дополнительными настройками функций искусственного интеллекта. Теперь пользователи могут управлять такими возможностями, как перевод, голосовой поиск и функция быстрого получения краткого содержания страницы.
Источник: ixbt.com
Агентская революция: Google представляет Gemini Omni, Spark и 3.5 Flash
Google объявила на конференции I/O 2026 о новой мультимодальной модели Gemini Omni, способной принимать любые типы данных и выдавать видео. Компания также презентовала агента Gemini Spark и флагмана Gemini 3.5 Flash, обещав увеличение расходов на инфраструктуру до $180–190 млрд в 2026 году.
Источник: ai-stat.ru
Anthropic прогнозирует экономический парадокс: рост ВВП и безработицы одновременно
CEO Anthropic Дарио Амодей заявил, что развитие ИИ приведёт к росту мирового ВВП на 5–10%, но одновременно вызовет всплеск безработицы до 10%. Этот сценарий противоречит традиционным экономическим представлениям и вызывает серьёзные опасения.
Источник: ai-stat.ru
AI-агенты провалили проверку реальной работой: справились только с 2.5%
Исследователи из Center for AI Safety и Scale AI создали бенчмарк Remote Labor Index, протестировав способность ИИ-агентов выполнять реальные проекты с бирж фрилансеров. Даже лучшие модели смогли решить лишь 2.5% задач на удовлетворительном уровне.
Источник: neurohive.io
ClawBench показал слабости современных ИИ-агентов: успешность выполнения реальных задач — 33%
Новый бенчмарк ClawBench измерил эффективность ИИ-агентов в выполнении настоящих повседневных задач интернета. Лучшая модель смогла справиться только с 33% заданий, значительно уступая результатам на стандартных бенчмарках, где показатели достигают 65–75%.
Источник: neurohive.io
OpenAI готовится к IPO осенью 2026 года после победы в суде
После успешного завершения судебного разбирательства, угрожавшего структуре и финансам OpenAI, компания вернулась к подготовке к публичному размещению акций, которое планируется провести в сентябре 2026 года.
Источник: techcrunch.com