Новый уровень AI: индекс фриланса, ролевой геймплей и выбор моделей — 22 июня 2026

Remote Labor Index показал, что даже лучшие AI-агенты способны решить лишь 2.5% реальных заданий с бирж фриланса . Этот показатель демонстрирует разрыв между лабораторными успехами и практической применимостью решений. Исследование Tencent показало, что современные AI плохо играют роль злодеев в играх: оценка качества игры составила всего 2.61 из 5 баллов . Основная причина — сложность балансировки этики и креативности в поведении персонажа. GLM-5 стала первой открытой моделью, способной соперничать с коммерческими решениями вроде Claude и GPT на ряде бенчмарков . Модель продемонстрировала выдающиеся результаты в генерации кода и текста, а также самостоятельное исполнение сложных команд. Выбор AI-модели стал вопросом специализации: каждая модель хороша в своей области. Например, Grok лидирует в разработке программного обеспечения, Gemini — в аналитике и исследованиях, Claude — в обработке больших документов . Эти данные помогают специалистам подобрать оптимальную модель под свою задачу, учитывая её специфические требования и ограничения.

Источники