OpenAI выпустила ChatGPT Images 2.0 с улучшенным качеством и разрешением
OpenAI анонсировала новую версию генератора изображений ChatGPT Images 2.0. Теперь модель поддерживает разрешение 2К, точное следование сложным инструкциям и мультиязычный текст. Новая версия занимает первое место по качеству генерации изображений согласно рейтингу LM Arena (+242 балла Elo относительно конкурентов).
Источник: neurohive.io
ClawBench показал низкую эффективность ИИ-агентов в выполнении повседневных задач
Исследователи представили бенчмарк ClawBench, проверяющий способность ИИ-агентов справляться с обычными бытовыми заданиями вроде бронирования билетов или оформления заказа. Даже лучшая модель — Claude Sonnet 4.6 — смогла решить только 33% предложенных задач. Традиционные тесты демонстрируют результативность около 65–75%.
Источник: neurohive.io
GLM-5 обогнала другие открытые модели по бенчмаркам генерации текста и кода
Китайская компания Zhipu AI совместно с университетом Цинхуа выпустили открытую языковую модель GLM-5. Она заняла первое место среди открытых моделей на Artificial Analysis и LMArena, лидируя также на BrowseComp и Human Language Evaluation (HLE). Модель способна не только отвечать на запросы, но и выполнять агентные задачи.
Источник: neurohive.io
Исследовали способности ИИ играть роли героев и злодеев
Учёные из Tencent и Университета Сунь Ятсена протестировали 17 крупных языковых моделей на умение вести диалоги в ролях различных персонажей. Средний показатель для положительных ролей составил 3.21 из 5 баллов, а для отрицательных — 2.61. Основная причина слабых результатов — отсутствие чётких механизмов выравнивания поведения моделей.
Источник: neurohive.io
Ведущие ИИ-агенты решили менее 3% реальных заданий фрилансеров
Команда Центра безопасности ИИ и компании Scale AI провела исследование Remote Labor Index (RLI), которое показало, что лучшие современные ИИ-агенты способны справиться только с 2.5% реальных рабочих задач, взятых с платформы Upwork. Задания охватывали широкий спектр деятельности, включая разработку игр и создание архитектурных чертежей.
Источник: neurohive.io
Акции Dell выросли на 35% благодаря росту выручки и популярности решений для ИИ
На открытии американских торгов акции производителя компьютеров и серверов Dell Technologies подорожали на 35%. Причиной стал сильный квартальный отчёт, превысивший прогнозы аналитиков, и высокий спрос на оборудование для искусственного интеллекта.
Источник: forbes.ru
Tech-компании платят пользователям за съёмку уборки дома для тренировки роботов
Стартап Shift предложил жителям Нью-Йорка бесплатную уборку квартир взамен на видеозапись процесса. Полученные материалы будут использованы для обучения домашних роботов уборке помещений. Подобное предложение планируется распространить и на другие города, включая Лондон.
Источник: theverge.com
Adobe представила Firefly AI Assistant — помощника дизайнера
Adobe продемонстрировала своего нового виртуального ассистента Firefly AI Assistant, предназначенного для помощи дизайнерам и художникам. Ассистент интегрируется с приложениями Adobe и помогает автоматизировать рутинные операции, сохраняя творческий контроль пользователя.
Источник: theverge.com