Утренние новости искусственного интеллекта снова полны интересных открытий и изменений. Среди наиболее заметных событий недели выделяются несколько значимых анонсов и исследований. Во-первых, компания Anthropic выпустила новое обновление своей популярной модели Claude — Claude Opus 4.7 . Эта версия демонстрирует значительный прогресс в области кодирования и сценариев взаимодействия с агентами. По результатам бенчмарка SWE-Bench Pro, модель показала впечатляющий результат — 64,3%, что существенно превосходит предыдущие версии и конкурентов, таких как GPT-5.4 и Gemini 3.1 Pro. Это подчеркивает стремление Anthropic удерживать лидирующие позиции в сфере разработки мощных ИИ-решений. Другим важным событием стало появление новой модели Meta — Muse Spark . Разработанная командой Александра Ванга, эта модель является первым продуктом Meta Superintelligence Labs. За короткий срок команда сумела создать систему, демонстрирующую высокий уровень интеграции мультимодальности и производительности. Хотя модель пока находится на ранней стадии развития, её потенциал обещает значительные перспективы для будущего искусственного интеллекта. Ещё одно значимое событие связано с новыми возможностями Codex от OpenAI . Последнее обновление позволило модели не только понимать текстовые запросы, но и взаимодействовать непосредственно с интерфейсом компьютера. Теперь пользователи могут поручать Codex выполнение сложных задач, связанных с управлением файлами, таблицами и коммуникацией. Такое нововведение делает взаимодействие с ИИ ещё более удобным и эффективным. Наконец, нельзя обойти вниманием исследование китайских учёных, посвящённое эффективности различных нейросетей в торговле акциями . Исследование показало, что две модели — Kimi-K2 и Qwen3-235B — продемонстрировали наилучшие результаты в управлении инвестиционным портфелем. Этот вывод подчёркивает важность дальнейшего изучения возможностей ИИ в финансовой индустрии. Эти события отражают стремительное развитие искусственного интеллекта и демонстрируют разнообразие подходов и направлений, в которых ведутся исследования и разработки.
Источники
- Claude Opus 4.7 вышел: 64.3% на SWE-Bench Pro и 3x разрешение зрения — ai-stat.ru
- Muse Spark: первый результат $14 млрд ставки Цукерберга на Александра Ванга — ai-stat.ru
- Codex научился кликать мышкой: OpenAI превращает его в суперприложение — ai-stat.ru
- Kimi-K2 и Qwen3-235B — лучшие нейросети для торговли акциями на бирже, выяснили китайские исследователи — neurohive.io