OpenAI представила ChatGPT Images 2.0 с улучшенным качеством и мультиязычностью
OpenAI анонсировала новую версию своей системы генерации изображений — ChatGPT Images 2.0. Новая модель основана на архитектуре gpt-image-2 и занимает первую строчку в рейтинге LM Arena по качеству визуализации. Среди ключевых особенностей — поддержка мультиязычного текста, точное следование сложным инструкциям и разрешение до 2К пикселей. Улучшения позволили новой модели набрать рекордные баллы Elo, значительно опередив ближайших конкурентов.
Источник: neurohive.io
GLM-5 стала первой открытой моделью, обогнавшей Claude и GPT на агентных задачах
Исследовательская группа Zhipu AI совместно с университетом Цинхуа представили GLM-5 — открытую языковую модель, ставшую лидером по ряду авторитетных бенчмарков. Она показала лучшие результаты среди open-weight моделей на платформах Artificial Analysis и LMArena, а также возглавила рейтинги BrowseComp и Human Language Evaluation (HLE). Отличие GLM-5 заключается в способности не только давать точные ответы, но и самостоятельно инициировать выполнение сложных команд.
Источник: neurohive.io
ClawBench: лучшие AI-агенты справляются только с третьими реальной повседневной работы
Новый бенчмарк ClawBench протестировал эффективность современных AI-агентов на выполнении типичных ежедневных задач, таких как бронирование рейсов, отклики на вакансии и оформление заказов. Даже самая мощная модель — Claude Sonnet 4.6 — смогла решить лишь около трети предложенных заданий. Эти показатели резко контрастируют с традиционными синтетическими тестами, где успех достигает 65–75%.
Источник: neurohive.io
AI-агенты эффективно выполнили менее 3% реальных задач фрилансеров
Команда исследователей из Центра безопасности ИИ и Scale AI провела эксперимент, собрав 240 реальных заданий с платформы Upwork. Их цель состояла в проверке возможностей AI-агентов решать практические задачи, такие как создание игр или архитектурные проекты. Несмотря на высокий уровень развития технологий, результат оказался скромным: успешное завершение составило лишь 2,5% от общего числа заданий.
Источник: neurohive.io
Тележки с искусственным интеллектом помогают покупателям выбирать товары в магазинах США
Instacart начала массово внедрять интеллектуальные тележки Caper Cart в американские супермаркеты. Оснащенные камерами, датчиками веса и экранами, они позволяют отслеживать покупки клиента в режиме реального времени, предлагая рекомендации и рекламные акции. Технология сочетает локальное распознавание товаров с облаком, используя данные свыше 1,6 миллиарда онлайн-заказов для анализа поведения покупателя.
Источник: ixbt.com
Harvard Business Review предупредил о рисках массового внедрения ИИ в бизнес-процессы
Исследование Harvard Business Review выявило проблему деградации знаний в организациях, активно использующих генеративные модели ИИ. Компании сталкиваются с ростом количества некачественных результатов и увеличением расходов на верификацию данных. Авторы подчеркнули, что чрезмерная зависимость от ИИ ведет к снижению уровня компетенций сотрудников и ухудшению процедур принятия решений.
Источник: ixbt.com
Гуру отрасли советуют выбирать AI-модель исходя из задачи, а не бренда
Анализируя тенденции 2026 года, эксперты отметили отсутствие единой универсальной модели. Вместо этого каждая крупная модель специализируется на конкретных задачах: Claude и Grok эффективны в кодировании, Gemini выделяется в исследованиях и обработке больших объемов данных, GPT демонстрирует сильные стороны в автоматизации вычислений. Пользователи рекомендуют ориентироваться именно на специфические потребности проекта, а не бренд производителя.
Источник: ai-stat.ru
Внедрение специализированных AI-решений становится трендом 2026 года
Согласно отчету GuruSup, эра универсальных моделей подходит к концу. Теперь пользователи выбирают решения, ориентируясь на конкретные задачи, а не пытаются найти одну единственную лучшую модель. Например, Grok лидирует в области программирования, Gemini — в научных исследованиях, Claude — в обработке документов большого объема, а GPT-5.5 эффективен в инструментах автоматизации. Такой подход позволяет оптимизировать затраты и повысить качество результата.
Источник: ai-stat.ru