Классический ML продолжает приносить реальные доходы компаниям из разных отраслей, несмотря на шумиху вокруг LLM и агентов . Платформенные инженеры активно работают над интеграцией LLM-сервисов в Kubernetes, решая проблемы производительности и масштабирования распределенных систем . Первые независимые исследования ставят под сомнение эффективность современных ИИ-агентов в выполнении реальных задач. Например, лучшие модели справляются только с 33% повседневных заданий на новом бенчмарке ClawBench , а на бирже фриланса успешны лишь в 2.5% случаев согласно индексу Remote Labor Index . Кроме того, специалисты продолжают изучать ограничения ИИ-моделей в ролевой игре, выявляя слабые стороны в сценарии игры злодеем . Эти данные помогут разработчикам и бизнесу принимать взвешенные решения относительно внедрения технологий искусственного интеллекта.
Источники
- Пока все смотрят на LLM: почему классический ML годами зарабатывает сотни миллионов? — habr.com
- AI inference на K8s: как выживать с LLM в кубере. DRA, GIE, LLM-D — habr.com
- ClawBench: лучший ИИ-агент смог успешно завершить только 33% реальных повседневных задач — neurohive.io
- Remote Labor Index: ведущие ИИ-агенты справились с 2.5% реальных задач с биржи фрилансеров — neurohive.io
- Какой ИИ способен сыграть злодея: сравнение алгоритмов выравнивания 17 моделей — neurohive.io