OpenAI представил ChatGPT Images 2.0 с поддержкой 2К-разрешения и мультиязычности
OpenAI анонсировала новую версию своей системы генерации изображений — ChatGPT Images 2.0. Новинка основана на модели gpt-image-2 и значительно превосходит конкурентов по качеству визуализации. Согласно рейтингу LM Arena, модель набрала рекордные баллы Elo благодаря идеальной прорисовке текста на множестве языков и точности выполнения сложных инструкций. Среди ключевых нововведений — поддержка высокого разрешения (до 2К) и способность понимать запросы на разных языках.
Источник: neurohive.io
Новый уровень автоматизации лабораторных работ: ИИ управляет оптическими пинцетами
Учёные из Швеции представили платформу SmartTrap, позволяющую искусственному интеллекту автоматически управлять оптическими пинцетами. Эти устройства позволяют захватывать и перемещать объекты микроскопического размера, включая молекулы ДНК и клетки. До сих пор работа с ними требовала ручного вмешательства специалиста. Теперь же алгоритм машинного зрения и глубокое обучение обеспечивают полную автономию процесса, существенно повышая эффективность биофизических исследований.
Источник: ixbt.com
Сбер готовится выпустить серию человекоподобных роботов осенью 2026-го
Герман Греф объявил о планах Сбербанка представить собственную линейку человекоподобных роботов уже осенью 2026 года. Первый прототип, названный Грин, оснащён нейросетью GigaChat и обладает ростом 180 см и весом 75 кг. Такие роботы смогут выполнять разнообразные задачи в сфере торговли, общественного питания и промышленности. Важной особенностью станет способность решать сложные когнитивные задачи без прямого человеческого контроля.
Источник: ixbt.com
ИИ-агенты выполнили только 33% реальных повседневных задач на новом бенчмарке ClawBench
Новый бенчмарк ClawBench протестировал способности современных агентов справляться с настоящими бытовыми задачами в сети Интернет. Задания включали бронирование рейсов, отклики на вакансии и оформление заказов онлайн. Даже самый сильный участник теста — модель Claude Sonnet 4.6 — сумел решить лишь треть предложенных заданий. Этот результат контрастирует с показателями стандартных бенчмарков, где успешность достигает 65–75%.
Источник: neurohive.io
Искусственный интеллект плохо играет роли злодеев: исследование показало низкие результаты
Специалисты из Китая выяснили, насколько эффективно современные крупные языковые модели способны играть роль героев и антагонистов в интерактивных играх. Среднее значение для положительных персонажей составило 3.21 балла из пяти возможных, тогда как отрицательные персонажи получили лишь 2.61 балла. Основная причина слабых результатов — отсутствие чётких критериев поведения и мотивации для злых персонажей.
Источник: neurohive.io
Фильм о Саме Альтмане снят с проката студией Amazon MGM
Фильм режиссёра Луки Гуаданьино, рассказывающий историю жизни главы OpenAI Сэма Альтмана, был неожиданно снят с прокатного графика студией Amazon MGM. Картина охватывала драматический период увольнения и последующего возвращения Альтмана на должность генерального директора. Причины отмены релиза пока остаются неизвестными.
Источник: theverge.com
Крупнейшие ИИ-агенты решили менее трёх процентов реальных задач фриланса
Команда специалистов представила новый бенчмарк Remote Labor Index (RLI), который оценивает способность ИИ-агентов выполнять реальные поручения с бирж фриланса. Анализируя 240 настоящих рабочих предложений, исследователи обнаружили, что лучшие представители современной генерации ИИ смогли справиться лишь с 2.5% поставленных задач на должном уровне качества.
Источник: neurohive.io
Баррет Зоф покинул OpenAI спустя пять месяцев после возвращения
Баррет Зоф, руководитель отдела продаж корпоративного сектора в OpenAI, снова ушёл из компании всего через пять месяцев после своего повторного прихода. Ранее Зоф занимал позицию технического директора стартапа Thinking Machines Lab, основанного бывшим техническим директором OpenAI Мирой Мурати. После возвращения в OpenAI Зоф отвечал за стратегию развития корпоративных решений перед планируемым выходом компании на биржу.
Источник: theverge.com