OpenAI улучшила ChatGPT Images 2.0
OpenAI представила новую версию генератора изображений ChatGPT Images 2.0. Она занимает лидирующие позиции по качеству визуализации текста на различных языках и точности выполнения сложных инструкций. Новая версия получила поддержку высокого разрешения (до 2К пикселей) и возможность рассуждать перед генерацией картинки. Согласно рейтингу LM Arena, модель набрала рекордные баллы Elo (+242 относительно конкурентов).
Источник: neurohive.io
Anthropic увеличила лимиты для Claude Code
Разработчикам, использующим платформу Anthropic, стали доступны увеличенные лимиты работы с моделью Claude Code. Ключевые изменения включают пятикратное повышение лимита обработки запросов в час для платных планов Pro, Max и Enterprise. Дополнительно сняты ограничения пиковых нагрузок и повышен уровень effort по умолчанию до xhigh. Эти меры направлены на улучшение стабильности сервиса и производительности приложений, работающих с большими объёмами данных.
Источник: ai-stat.ru
Новый бенчмарк показывает слабые места ИИ-агентов
Исследовательская группа NeuroHive провела тестирование современных ИИ-агентов на выполнении реальных повседневных задач через новый бенчмарк ClawBench. Лучшая модель смогла решить только треть предложенных заданий (33%), тогда как на стандартных синтетических тестах показатели достигают 65–75%. Этот разрыв демонстрирует ограниченность текущих подходов к оценке эффективности агентов.
Источник: neurohive.io
Первая геотермальная сделка Amazon для дата-центров
Amazon заключил контракт с энергетической компанией NV Energy на поставку 100 МВт геотермальной электроэнергии для собственных дата-центров. Основную роль в проекте играет стартап Zanskar, применяющий технологии искусственного интеллекта для выявления скрытых термальных ресурсов. Сделка позволит сократить углеродный след IT-инфраструктуры Amazon и повысить устойчивость энергоснабжения.
Источник: ixbt.com
Российские покупатели экономят с помощью ИИ-агента «Найти дешевле»
Яндекс представил статистику использования своего ИИ-агента «Найти дешевле», запущенного в конце 2025 года. Пользователи экономят в среднем 21% на покупках электроники, достигая экономии до 40% в отдельных случаях. Агент собирает актуальные предложения магазинов и формирует оптимальные рекомендации. За несколько месяцев трафик на площадки электронной коммерции из Алисы AI увеличился на 159%.
Источник: ixbt.com
Исследование показало низкую эффективность ИИ-агентов на биржах фриланса
Центр безопасности ИИ совместно с командой Scale AI представили бенчмарк Remote Labor Index (RLI), оценивающий способность ИИ-агентов решать реальные задачи фрилансеров. Из 240 реальных заказов на платформе Upwork лучшие ИИ смогли справиться только с 2,5% задач. Полученные результаты подчеркивают необходимость дальнейшего развития технологий для автоматизации рутинных работ.
Источник: neurohive.io
Новое исследование выявляет проблемы ролевой игры больших языковых моделей
Группа учёных из Китая изучила способности крупных языковых моделей к выполнению ролей в играх. Выяснилось, что даже выдающиеся модели демонстрируют скромные успехи: средняя оценка за игру героя составила 3,21 из 5 баллов, а за персонажа-злодея — всего 2,61. Основная причина слабых результатов связана с недостаточной проработанностью механизмов адаптации поведения моделей к специфическим требованиям сценариев.
Источник: neurohive.io
Самостоятельность Apple под угрозой: закрытие конфигураций Mac Studio
Apple неожиданно прекратила продажу версий Mac Studio с максимальной памятью (512 ГБ и 256 ГБ). Такие машины использовались энтузиастами для запуска тяжёлых LLM-моделей локально. Вместо ожидаемого выхода новой серии M5 Ultra осенью 2026 года, планы смещаются ближе к концу года. Отсутствие мощных конфигураций создаёт трудности для специалистов, предпочитающих автономные решения без облаков.
Источник: ai-stat.ru