Новая версия ChatGPT Images 2.0 от OpenAI демонстрирует значительное улучшение качества визуализации. Теперь модель поддерживает разрешение 2K и способна точно следовать сложным инструкциям, особенно выделившись в рендеринге текста на разных языках . GLM-5, разработка Zhipu AI и Tsinghua University, вышла на лидирующие позиции среди открытых моделей по ряду ключевых метрик. Она занимает первое место среди open-weight моделей на Artificial Analysis и является лидером в кодировании и обработке текста на LMArena. Эта модель показывает способность не только отвечать на запросы, но и решать комплексные задачи, такие как самостоятельная обработка веб-контента . Исследования демонстрируют ограниченные способности современных ИИ-агентов справляться с настоящими рабочими задачами. Например, на бенчмарке ClawBench лучшие модели смогли решить лишь треть реальных заданий, связанных с бронированием рейсов, откликом на вакансии и оформлением заказов онлайн . Аналогично, на Remote Labor Index лидеры рынка выполнили только 2,5% реальных задач с бирж фриланса . Эти данные подчеркивают необходимость дальнейшего развития технологий, направленных на повышение эффективности и применимости ИИ-агентов в повседневной жизни и профессиональной деятельности.
Источники
- ChatGPT Images 2.0: OpenAI запустила обновление модели генерации изображений с рассуждениям, 2K-разрешением и мультиязычным текстом — neurohive.io
- GLM-5: топ-1 открытая модель для генерации кода и текста, конкурирующая с Claude и GPT на агентных задачах — neurohive.io
- ClawBench: лучший ИИ-агент смог успешно завершить только 33% реальных повседневных задач — neurohive.io
- Remote Labor Index: ведущие ИИ-агенты справились с 2.5% реальных задач с биржи фрилансеров — neurohive.io