Google IO 2026, OpenAI обновляет ChatGPT Images, GLM-5 лидирует в бенчмарках — 19 мая 2026

Google представил новую версию Gemini 3.5 Flash с акцентом на агентов

Google объявил о запуске Gemini 3.5 Flash — своей мощной модели, ориентированной на автономность выполнения сложных задач и разработку ПО. Новый продукт стал центральным событием ежегодной конференции Google I/O 2026. Ранее компания заявляла о намерении сместить фокус с чат-ботов на интеллектуальных агентов, способных решать практические задачи. Gemini 3.5 Flash позиционируется как следующий этап развития этой стратегии.

Источник: techcrunch.com

OpenAI выпустил ChatGPT Images 2.0 с улучшенной генерацией и разрешением

OpenAI презентовала вторую версию генератора изображений ChatGPT Images 2.0. Новая модель основана на архитектуре gpt-image-2 и занимает первое место во всех категориях генерации изображений согласно рейтингу LM Arena. Улучшения включают идеальное отображение текста на нескольких языках и точное выполнение сложных инструкций. Важнейшим техническим достижением стало разрешение 2К и способность рассуждать при выполнении заданий.

Источник: neurohive.io

GLM-5 становится первой открытой моделью-лидером на бенчмарках

Zhipu AI совместно с Tsinghua University представили GLM-5 — открытую языковую модель, занявшую первые места на ряде авторитетных тестов. Среди достижений: первое место среди открытых моделей на Artificial Analysis, лидирующие позиции в генерации кода и текста на LMArena, лучшие показатели на BrowseComp и Human Language Evaluation (HLE) с использованием инструментов. Модель способна не только отвечать на запросы, но и действовать автономно.

Источник: neurohive.io

Google вводит новые информационные агенты для мониторинга изменений

Компания Google объявила о запуске информационных агентов, работающих в фоне и уведомляющих пользователей о важных изменениях и обновлениях. Эти агенты способны отслеживать интересующие темы и оперативно сообщать пользователям о новых событиях. Функция расширяет возможности персонализированного поиска и помогает оставаться в курсе актуальных событий.

Источник: techcrunch.com

Методы тестирования ИИ-агентов: ClawBench показывает слабые стороны

Исследовательская группа создала бенчмарк ClawBench, предназначенный для проверки способности ИИ-агентов справляться с повседневными задачами в реальной жизни. Лучшая модель, Claude Sonnet 4.6, смогла решить только треть предложенных задач. Бенчмарк выявил разрыв между показателями на синтетических тестах и эффективностью в реальных ситуациях.

Источник: neurohive.io

Антропик привлекает Андрея Карпатого, известного специалиста по ИИ

Андрей Карпати, известный разработчик нейросетей, перешел в компанию Anthropic после периода сотрудничества с OpenAI и Tesla. Его возвращение к исследовательской деятельности связано с интересом к развитию ИИ-агентов для программирования. Решение перейти в Anthropic рассматривается экспертами как значительный шаг для компании и потеря для OpenAI.

Источник: ixbt.com

Исследование показало низкую эффективность ИИ-агентов на биржевых платформах

Команда Центра безопасности ИИ и Scale AI провела исследование эффективности ИИ-агентов на платформе фриланса Upwork. Из 240 реальных задач удалось выполнить только 2,5% на удовлетворительном уровне. Работа показала ограниченность современных решений в контексте практической реализации задач реального бизнеса.

Источник: neurohive.io

Cerebras выходит на IPO c поддержкой OpenAI и стоимостью $60 млрд

Cerebras Systems, производитель специализированных вычислительных платформ для обработки больших языковых моделей, провел успешное размещение акций на NASDAQ. Стоимость компании достигла $60 млрд. Финансовый директор компании подтвердил сотрудничество с OpenAI, указав, что Cerebras обрабатывает их модели 5.4 и 5.5. Эта информация подтверждает начало партнерства, ранее объявленного в апреле.

Источник: ai-stat.ru

Google представил новую версию Gemini 3.5 Flash с акцентом на агентов

Источник: techcrunch.com

OpenAI выпустил ChatGPT Images 2.0 с улучшенной генерацией и разрешением

Источник: neurohive.io

GLM-5 становится первой открытой моделью-лидером на бенчмарках

Источник: neurohive.io

Google вводит новые информационные агенты для мониторинга изменений

Источник: techcrunch.com

Методы тестирования ИИ-агентов: ClawBench показывает слабые стороны

Источник: neurohive.io

Антропик привлекает Андрея Карпатого, известного специалиста по ИИ

Источник: ixbt.com

Исследование показало низкую эффективность ИИ-агентов на биржевых платформах

Источник: neurohive.io

Cerebras выходит на IPO c поддержкой OpenAI и стоимостью $60 млрд

Источник: ai-stat.ru