OpenAI обновила ChatGPT Images, GLM-5 обошла Claude и GPT — 21 июня 2026

OpenAI представила ChatGPT Images 2.0 с улучшенным качеством и мультиязычностью

OpenAI анонсировала новую версию своей системы генерации изображений — ChatGPT Images 2.0. Новая модель основана на архитектуре gpt-image-2 и занимает первую строчку в рейтинге LM Arena по качеству визуализации. Среди ключевых особенностей — поддержка мультиязычного текста, точное следование сложным инструкциям и разрешение до 2К пикселей. Улучшения позволили новой модели набрать рекордные баллы Elo, значительно опередив ближайших конкурентов.

Источник: neurohive.io

GLM-5 стала первой открытой моделью, обогнавшей Claude и GPT на агентных задачах

Исследовательская группа Zhipu AI совместно с университетом Цинхуа представили GLM-5 — открытую языковую модель, ставшую лидером по ряду авторитетных бенчмарков. Она показала лучшие результаты среди open-weight моделей на платформах Artificial Analysis и LMArena, а также возглавила рейтинги BrowseComp и Human Language Evaluation (HLE). Отличие GLM-5 заключается в способности не только давать точные ответы, но и самостоятельно инициировать выполнение сложных команд.

Источник: neurohive.io

ClawBench: лучшие AI-агенты справляются только с третьими реальной повседневной работы

Новый бенчмарк ClawBench протестировал эффективность современных AI-агентов на выполнении типичных ежедневных задач, таких как бронирование рейсов, отклики на вакансии и оформление заказов. Даже самая мощная модель — Claude Sonnet 4.6 — смогла решить лишь около трети предложенных заданий. Эти показатели резко контрастируют с традиционными синтетическими тестами, где успех достигает 65–75%.

Источник: neurohive.io

AI-агенты эффективно выполнили менее 3% реальных задач фрилансеров

Команда исследователей из Центра безопасности ИИ и Scale AI провела эксперимент, собрав 240 реальных заданий с платформы Upwork. Их цель состояла в проверке возможностей AI-агентов решать практические задачи, такие как создание игр или архитектурные проекты. Несмотря на высокий уровень развития технологий, результат оказался скромным: успешное завершение составило лишь 2,5% от общего числа заданий.

Источник: neurohive.io

Тележки с искусственным интеллектом помогают покупателям выбирать товары в магазинах США

Instacart начала массово внедрять интеллектуальные тележки Caper Cart в американские супермаркеты. Оснащенные камерами, датчиками веса и экранами, они позволяют отслеживать покупки клиента в режиме реального времени, предлагая рекомендации и рекламные акции. Технология сочетает локальное распознавание товаров с облаком, используя данные свыше 1,6 миллиарда онлайн-заказов для анализа поведения покупателя.

Источник: ixbt.com

Harvard Business Review предупредил о рисках массового внедрения ИИ в бизнес-процессы

Исследование Harvard Business Review выявило проблему деградации знаний в организациях, активно использующих генеративные модели ИИ. Компании сталкиваются с ростом количества некачественных результатов и увеличением расходов на верификацию данных. Авторы подчеркнули, что чрезмерная зависимость от ИИ ведет к снижению уровня компетенций сотрудников и ухудшению процедур принятия решений.

Источник: ixbt.com

Гуру отрасли советуют выбирать AI-модель исходя из задачи, а не бренда

Анализируя тенденции 2026 года, эксперты отметили отсутствие единой универсальной модели. Вместо этого каждая крупная модель специализируется на конкретных задачах: Claude и Grok эффективны в кодировании, Gemini выделяется в исследованиях и обработке больших объемов данных, GPT демонстрирует сильные стороны в автоматизации вычислений. Пользователи рекомендуют ориентироваться именно на специфические потребности проекта, а не бренд производителя.

Источник: ai-stat.ru

Внедрение специализированных AI-решений становится трендом 2026 года

Согласно отчету GuruSup, эра универсальных моделей подходит к концу. Теперь пользователи выбирают решения, ориентируясь на конкретные задачи, а не пытаются найти одну единственную лучшую модель. Например, Grok лидирует в области программирования, Gemini — в научных исследованиях, Claude — в обработке документов большого объема, а GPT-5.5 эффективен в инструментах автоматизации. Такой подход позволяет оптимизировать затраты и повысить качество результата.

Источник: ai-stat.ru

OpenAI представила ChatGPT Images 2.0 с улучшенным качеством и мультиязычностью

Источник: neurohive.io

GLM-5 стала первой открытой моделью, обогнавшей Claude и GPT на агентных задачах

Источник: neurohive.io

ClawBench: лучшие AI-агенты справляются только с третьими реальной повседневной работы

Источник: neurohive.io

AI-агенты эффективно выполнили менее 3% реальных задач фрилансеров

Источник: neurohive.io

Тележки с искусственным интеллектом помогают покупателям выбирать товары в магазинах США

Источник: ixbt.com

Harvard Business Review предупредил о рисках массового внедрения ИИ в бизнес-процессы

Источник: ixbt.com

Гуру отрасли советуют выбирать AI-модель исходя из задачи, а не бренда

Источник: ai-stat.ru

Внедрение специализированных AI-решений становится трендом 2026 года

Источник: ai-stat.ru