Fable 5 от Anthropic вышла в публичный доступ, но с жёсткими ограничениями. Разработчики назвали эту версию самой мощной моделью компании, однако встроенные фильтры существенно снижают её потенциал. Тестировщики утверждают, что ограничения мешают полноценно оценить реальную силу новой версии . Исследование Remote Labor Index показало, что современные AI-агенты способны решить менее 3% реальных задач фрилансеров. Для сравнения, на синтетических бенчмарках эффективность достигает 65–75%. Авторы исследования подчёркивают разрыв между лабораторными показателями и производительностью в реальных условиях . GLM-5 стала первой открытой моделью, обошедшей коммерческие аналоги в ряде тестов. Она занимает первые места на бенчмарках Artificial Analysis, LMArena и BrowseComp, демонстрируя конкурентоспособность с ведущими моделями отрасли . Siri AI получила долгожданное обновление, позволяющее добавлять мероприятия из писем и календарей одним кликом. Теперь пользователи смогут быстро переносить данные из электронных сообщений на свои устройства, упрощая планирование повседневной деятельности . Российские исследователи разработали метод оптимизации нейросетей без снижения качества. Новый подход позволяет сжимать крупные матрицы данных, сохраняя точность предсказаний. Эта технология обещает ускорить работу автономных устройств и чат-ботов вне сети .
Источники
- [Перевод] Каково это — работать с Fable 5 (Mythos) — habr.com
- Remote Labor Index: ведущие ИИ-агенты справились с 2.5% реальных задач с биржи фрилансеров — neurohive.io
- GLM-5: топ-1 открытая модель для генерации кода и текста, конкурирующая с Claude и GPT на агентных задачах — neurohive.io
- I tried Siri AI, and so far it actually works — theverge.com
- Решение математической задачи ускорит работу чат-ботов и роботов без интернета — iz.ru