Google представил новую версию Gemini 3.5 Flash с акцентом на агентов
Google объявил о запуске Gemini 3.5 Flash — своей мощной модели, ориентированной на автономность выполнения сложных задач и разработку ПО. Новый продукт стал центральным событием ежегодной конференции Google I/O 2026. Ранее компания заявляла о намерении сместить фокус с чат-ботов на интеллектуальных агентов, способных решать практические задачи. Gemini 3.5 Flash позиционируется как следующий этап развития этой стратегии.
Источник: techcrunch.com
OpenAI выпустил ChatGPT Images 2.0 с улучшенной генерацией и разрешением
OpenAI презентовала вторую версию генератора изображений ChatGPT Images 2.0. Новая модель основана на архитектуре gpt-image-2 и занимает первое место во всех категориях генерации изображений согласно рейтингу LM Arena. Улучшения включают идеальное отображение текста на нескольких языках и точное выполнение сложных инструкций. Важнейшим техническим достижением стало разрешение 2К и способность рассуждать при выполнении заданий.
Источник: neurohive.io
GLM-5 становится первой открытой моделью-лидером на бенчмарках
Zhipu AI совместно с Tsinghua University представили GLM-5 — открытую языковую модель, занявшую первые места на ряде авторитетных тестов. Среди достижений: первое место среди открытых моделей на Artificial Analysis, лидирующие позиции в генерации кода и текста на LMArena, лучшие показатели на BrowseComp и Human Language Evaluation (HLE) с использованием инструментов. Модель способна не только отвечать на запросы, но и действовать автономно.
Источник: neurohive.io
Google вводит новые информационные агенты для мониторинга изменений
Компания Google объявила о запуске информационных агентов, работающих в фоне и уведомляющих пользователей о важных изменениях и обновлениях. Эти агенты способны отслеживать интересующие темы и оперативно сообщать пользователям о новых событиях. Функция расширяет возможности персонализированного поиска и помогает оставаться в курсе актуальных событий.
Источник: techcrunch.com
Методы тестирования ИИ-агентов: ClawBench показывает слабые стороны
Исследовательская группа создала бенчмарк ClawBench, предназначенный для проверки способности ИИ-агентов справляться с повседневными задачами в реальной жизни. Лучшая модель, Claude Sonnet 4.6, смогла решить только треть предложенных задач. Бенчмарк выявил разрыв между показателями на синтетических тестах и эффективностью в реальных ситуациях.
Источник: neurohive.io
Антропик привлекает Андрея Карпатого, известного специалиста по ИИ
Андрей Карпати, известный разработчик нейросетей, перешел в компанию Anthropic после периода сотрудничества с OpenAI и Tesla. Его возвращение к исследовательской деятельности связано с интересом к развитию ИИ-агентов для программирования. Решение перейти в Anthropic рассматривается экспертами как значительный шаг для компании и потеря для OpenAI.
Источник: ixbt.com
Исследование показало низкую эффективность ИИ-агентов на биржевых платформах
Команда Центра безопасности ИИ и Scale AI провела исследование эффективности ИИ-агентов на платформе фриланса Upwork. Из 240 реальных задач удалось выполнить только 2,5% на удовлетворительном уровне. Работа показала ограниченность современных решений в контексте практической реализации задач реального бизнеса.
Источник: neurohive.io
Cerebras выходит на IPO c поддержкой OpenAI и стоимостью $60 млрд
Cerebras Systems, производитель специализированных вычислительных платформ для обработки больших языковых моделей, провел успешное размещение акций на NASDAQ. Стоимость компании достигла $60 млрд. Финансовый директор компании подтвердил сотрудничество с OpenAI, указав, что Cerebras обрабатывает их модели 5.4 и 5.5. Эта информация подтверждает начало партнерства, ранее объявленного в апреле.
Источник: ai-stat.ru