OpenAI представила новую версию генератора изображений ChatGPT Images 2.0
OpenAI анонсировала обновление своей системы генерации изображений ChatGPT Images 2.0, основанной на модели gpt-image-2. Новая версия показала значительное улучшение качества визуализации, заняв лидирующие позиции по ряду метрик. Например, она набрала на 242 балла Elo больше, чем ближайший конкурент, благодаря улучшенному рендерингу текста на различных языках и точности выполнения сложных инструкций. Среди ключевых особенностей обновления — поддержка разрешения 2К и возможность работы с мультиязычными текстовыми подсказками.
Источник: neurohive.io
Anthropic повысила лимиты обработки кода в Claude Code
Разработчики, сталкивавшиеся ранее с ограничениями в обработке кода моделью Claude Code от Anthropic, получили хорошие новости. Компания удвоила лимиты пятичасовых ограничений для подписанных планов Pro, Max, Team и seat-based Enterprise. Дополнительно сняты ограничения пиковых часов для Pro и Max, что позволит избежать снижения производительности в периоды высокого трафика. Изменения вступили в силу немедленно, без ожидания в очереди.
Источник: ai-stat.ru
Mozilla обнаружила 271 уязвимость в Firefox с помощью Claude Mythos
Mozilla использовала модель Claude Mythos от Anthropic для поиска уязвимостей в браузере Firefox. За короткий срок удалось выявить и исправить рекордное число ошибок безопасности — 271. Эта инициатива демонстрирует потенциал больших языковых моделей (LLM) в автоматизации процессов тестирования программного обеспечения. Подробности подхода и рекомендации для других команд опубликованы в блоге Mozilla.
Источник: habr.com
GLM-5 стала первой открытой моделью, конкурирующей с Claude и GPT на агентных задачах
Исследовательский коллектив Zhipu AI и Tsinghua University представил GLM-5 — первую открытую языковую модель, способную соперничать с коммерческими моделями вроде Claude и GPT на ряде тестов. GLM-5 занимает первые места среди открытых моделей на бенчмарках Artificial Analysis и LMArena, а также лидирует на BrowseComp и Human Language Evaluation (HLE) с использованием инструментов. Модель способна не только отвечать на запросы, но и решать комплексные задачи, взаимодействуя с внешними сервисами.
Источник: neurohive.io
Новый голосовой модуль OpenAI улучшает обработку речи в API
OpenAI добавила новые функции распознавания голоса в свой API. Обновления помогут улучшить качество обслуживания клиентов, предоставляя точные данные о взаимодействии пользователей с системами поддержки. Помимо клиентского сервиса, технология применима в образовании и контент-платформах. Пока детали нововведений раскрываются постепенно, разработчики ожидают повышения эффективности интеграции голосовых интерфейсов.
Источник: techcrunch.com
Крупнейшие ИИ-агенты решили менее 3% реальных задач фрилансеров
Команда Центра безопасности ИИ и Scale AI провела исследование, названное Remote Labor Index (RLI), чтобы оценить способность ИИ-агентов выполнять реальную работу фрилансеров. Были собраны 240 реальных заданий с платформы Upwork, охватывающих широкий спектр деятельности, от разработки игр до проектирования зданий. Анализ показал, что лучшие современные ИИ-агенты смогли решить лишь 2,5% задач на удовлетворительном уровне, подчеркивая значительные пробелы в практических возможностях ИИ.
Источник: neurohive.io
Исследование показало низкую эффективность ИИ в ролевой игре
Специалисты из Tencent Multimodal Department и Университета Сунь Ятсена изучили способности больших языковых моделей к выполнению ролей в играх. Несмотря на успехи в некоторых областях, результаты оказались скромными: средняя оценка героев составила 3,21 из 5, а для отрицательных персонажей показатель упал до 2,61. Основная причина низкой результативности заключается в недостаточной гибкости моделей при адаптации к нестандартным сценариям игры.
Источник: neurohive.io
Игровые гиганты видят в искусственном интеллекте мощный инструмент для разработки игр
Sony поделилась своим взглядом на роль искусственного интеллекта в игровой индустрии. Генерация контента с помощью ИИ становится популярной в крупных проектах, хотя многие независимые разработчики пока скептически относятся к технологии. Sony подчеркивает, что видение, дизайн и эмоциональность игр останутся прерогативой студий и исполнителей, а ИИ будет служить инструментом для расширения возможностей создателей.
Источник: theverge.com