OpenAI улучшила свою модель генерации изображений, выпустив ChatGPT Images 2.0. Новинка демонстрирует значительное превосходство над ближайшими конкурентами благодаря точности исполнения сложных инструкций и качеству рендеринга текста на разных языках . На другом фронте китайские исследователи представили GLM-5 — открытую языковую модель, которая впервые обогнала коммерческие аналоги на популярных бенчмарках. Она занимает первые места в генерации кода и текста, а также эффективно решает агентные задачи . Тем временем инженеры продолжают сталкиваться с проблемами интеграции AI-технологий в реальную жизнь. Например, исследование показало, что современные AI-агенты способны решить лишь 2,5% реальных заданий с бирж фриланса, несмотря на успехи на синтетических бенчмарках . Наконец, разработчики сталкиваются с вызовом масштабирования решений на основе Retrieval-Augmented Generation (RAG). Простое создание демоверсии быстро превращается в сложную техническую проблему при переходе на промышленный уровень обработки данных . Эти новости подчеркивают динамику развития AI-индустрии: новые прорывы соседствуют с серьезными техническими ограничениями и вызовами.
Источники
- ChatGPT Images 2.0: OpenAI запустила обновление модели генерации изображений с рассуждениям, 2K-разрешением и мультиязычным текстом — neurohive.io
- GLM-5: топ-1 открытая модель для генерации кода и текста, конкурирующая с Claude и GPT на агентных задачах — neurohive.io
- Remote Labor Index: ведущие ИИ-агенты справились с 2.5% реальных задач с биржи фрилансеров — neurohive.io
- RAG от А до Я: шпаргалка архитектора (векторные базы, чанкинг, реранкинг и 8 граблей продакшена) — habr.com