Anthropic ведёт переговоры о создании кастомного AI-чипа с Samsung
Компания Anthropic сообщила о переговорах с Samsung относительно производства специализированного процессора для обработки AI-задач. Новость появилась спустя неделю после анонса собственного AI-чипа OpenAI совместно с Broadcom. Создание собственных микросхем позволит снизить зависимость от внешних поставщиков вычислительных ресурсов и повысить производительность моделей вроде Claude.
Источник: techcrunch.com
OpenAI улучшила ChatGPT Images 2.0 с поддержкой 2К-разрешения и мультиязычного текста
OpenAI объявила о релизе обновления генератора изображений ChatGPT Images 2.0. Новая версия получила разрешение 2К и возможность точно воспроизводить тексты на множестве языков. Согласно LM Arena, модель показала значительное улучшение качества визуализации и понимания сложных инструкций. Улучшение связано с применением технологии GPT-style reasoning для работы с изображениями.
Источник: neurohive.io
GLM-5 — новая open-source модель превзошла закрытые аналоги на ряде тестов
Исследовательский коллектив Zhipu AI и Tsinghua University представил GLM-5 — первую открытую модель, способную соперничать с коммерческими аналогами от OpenAI и Anthropic. Модель занимает лидирующие позиции на открытых бенчмарках по качеству генерации текста и программирования. GLM-5 отличается высокой эффективностью выполнения агентных задач, связанных с использованием инструментов и браузера.
Источник: neurohive.io
Новый бенчмарк ClawBench показал низкую эффективность агентов на реальных задачах
Команда исследователей разработала бенчмарк ClawBench, предназначенный для тестирования способности ИИ-агентов решать практические задачи интернета. Лучшая модель — Claude Sonnet 4.6 — смогла справиться только с 33% заданий. Этот показатель значительно уступает результатам на стандартных синтетических бенчмарках, где успешность достигает 65–75%.
Источник: neurohive.io
Claude Sonnet 5 получил сильные улучшения для агентных задач
Anthropic выпустила очередное обновление серии Claude — модель Sonnet 5. Основное внимание уделено улучшению способностей агента: планированию действий, использованию инструментов и браузеров, написанию и проверке кода. Несмотря на серьёзные улучшения, компания признаёт, что Sonnet 5 пока не является полноценной заменой популярной модели Opus.
Источник: neurohive.io
Рост числа сотрудников Anthropic сигнализирует о подготовке к прорыву в AGI
За последний год штат Anthropic удвоился, достигнув отметки в 2300 специалистов. Среди новоприбывших — Андрей Карпаты, основатель OpenAI и известный эксперт в области машинного обучения. Такой быстрый набор кадров свидетельствует о намерении компании ускорить разработку технологий общего искусственного интеллекта (AGI).
Источник: ai-stat.ru
Anthropic временно отключила свою самую мощную модель из-за ограничений экспорта
Модель Claude Fable 5 была отключена почти на месяц из-за требований американского Министерства торговли по контролю над экспортом технологий. Ограничение касалось невозможности проверки гражданства пользователей на стороне API. После снятия запрета модель вновь доступна глобально.
Источник: ai-stat.ru
Исследование показало слабое умение ИИ играть роль отрицательных героев
Группа учёных из Китая обнаружила, что современные языковые модели плохо справляются с ролевой игрой, особенно когда нужно изобразить персонажа-злодея. Средний рейтинг игры положительными героями составил 3.21 из 5, тогда как оценка исполнения роли отрицательного героя упала до 2.61. Причиной названо отсутствие должного уровня детализации и мотивации в поведении виртуальных персонажей.
Источник: neurohive.io