Сегодня утром внимание сосредоточено на двух значимых событиях в индустрии искусственного интеллекта. Во-первых, компания OpenAI представила обновленную версию своей модели генерации изображений — ChatGPT Images 2.0 . Новинка получила высокий рейтинг благодаря точной визуализации сложных инструкций и поддержке множества языков. За первые дни модель набрала свыше тысячи очков в рейтинге Image Arena, значительно опередив ближайших конкурентов. Во-вторых, Anthropic выпустила очередное обновление своего популярного агента Claude — версию 4.7 . Одной из ключевых особенностей стала интеграция режима рассуждений, позволяющего пользователям получать пошаговое объяснение решений. Однако пользователи отмечают, что прежняя бизнес-модель подписки оказалась недостаточно гибкой для интенсивного использования, что вызвало критику со стороны сообщества. Ещё одна важная новость касается платформы Rutube, которая поделилась подробностями о создании собственной системы распознавания речи . Разработчики столкнулись с необходимостью адаптации популярных решений, таких как Whisper, под специфические условия видеохостинга. Им удалось построить производительную систему, способную обрабатывать до 1200 видеороликов в час. Отдельного внимания заслуживает проект OpenGame , созданный исследователями из CUHK MMLab. Открытый фреймворк позволяет создавать полноценные браузерные игры по текстовым описаниям. Такой подход открывает перспективы для быстрого прототипирования игровых проектов силами одного специалиста. Завершают утренние новости публикации о конкуренции китайских и западных компаний в сфере AI-инфраструктуры. Китай столкнулся с потерями высококвалифицированных специалистов, вызванными напряженностью отношений с США . Одновременно наблюдается рост интереса к открытым моделям и инструментам, таким как Kimi K2.6 , которые становятся популярными среди пользователей благодаря доступной лицензии и высокой производительности. Эти события подчеркивают динамику развития рынка искусственного интеллекта и показывают разнообразие подходов к решению актуальных задач.
Источники
- ChatGPT Images 2.0: OpenAI запустила обновление модели генерации изображений с рассуждениям, 2K-разрешением и мультиязычным текстом — neurohive.io
- Глава growth Anthropic: «План больше не работает» — ai-stat.ru
- От MVP на Whisper до собственной ASR: как мы построили платформу субтитров для RUTUBE — habr.com
- OpenGame: ИИ-агент создает полноценные игры с нуля по текстовому описанию — neurohive.io
- Смерть Ван Даньхао: что теряет Китай в гонке за AI-инфраструктуру — ai-stat.ru
- Kimi K2.6 неделю спустя: open-source проголосовал кошельком — ai-stat.ru