GraphLens-MCP упростил подключение графа кода к агентам, сократив затраты на запросы grep в 10–23 раза . Новый инструмент позволяет быстро интегрировать структуру проекта и анализировать влияние изменений. Для разработчиков крупных проектов это значительное ускорение процессов рефакторинга и аудита. GLM-5 вышла в лидеры открытых моделей по бенчмаркам, обогнав даже закрытые аналоги вроде Claude и GPT . Она показала лучшие результаты в кодировании, обработке естественного языка и задачах с использованием инструментов. Практикам стоит обратить внимание на её потенциал в разработке и аналитике. ClawBench протестировал способность ИИ-агентов решать реальные ежедневные задачи интернета, такие как бронирование рейсов или оформление заказов. Даже самый сильный агент справился лишь с 33% заданий , тогда как на стандартных бенчах показатели достигают 65–75%. Remote Labor Index подтвердил низкую эффективность ИИ-фрилансеров: лучшие модели выполнили лишь 2,5% реальных рабочих задач с бирж фриланса . Это означает, что хотя прогресс в генерации контента очевиден, применение ИИ в реальной рабочей среде остаётся ограниченной задачей. Эти данные помогут практикующим специалистам точнее оценивать возможности современных решений и выбирать подходящие инструменты для конкретных задач.
Источники
- Граф кода одной командой: ставим graphlens-mcp в проект и перестаём жечь токены на grep — habr.com
- GLM-5: топ-1 открытая модель для генерации кода и текста, конкурирующая с Claude и GPT на агентных задачах — neurohive.io
- ClawBench: лучший ИИ-агент смог успешно завершить только 33% реальных повседневных задач — neurohive.io
- Remote Labor Index: ведущие ИИ-агенты справились с 2.5% реальных задач с биржи фрилансеров — neurohive.io