OpenAI обновила ChatGPT Images до версии 2.0 — теперь модель поддерживает разрешение 2К, точные инструкции и мультиязычность . Сразу после релиза модель поднялась на первую строчку рейтингов генерации изображений, обогнав ближайших конкурентов на +242 балла ELO благодаря качеству рендера текста и точности выполнения сложных заданий. Тем временем Google анонсировала интеграцию Gemini с macOS, расширяя аудиторию своего виртуального помощника Gemini Spark . Пользователи смогут получать помощь круглосуточно вне зависимости от платформы. GLM-5 от Zhipu AI и Tsinghua University вышла в лидеры открытых моделей по бенчмаркам. Модель уверенно побеждает в генерации кода и текста, демонстрируя лучшие результаты на LMArena и Artificial Analysis . Отдельно стоит отметить проблемы AI-инженеров с управлением кешем в моделях типа vLLM. Один неправильно поставленный символ в системном prompt может привести к сбросу кеша и потере производительности. Автор подробно разобрал причины и механизмы работы памяти на уровне GPU . Эти обновления показывают, что рынок AI продолжает развиваться быстрыми темпами, предлагая новые инструменты и одновременно сталкиваясь с новыми техническими вызовами.
Источники
- ChatGPT Images 2.0: OpenAI запустила обновление модели генерации изображений с рассуждениям, 2K-разрешением и мультиязычным текстом — neurohive.io
- ИИ как часть инженерной культуры: исследуем глубину внедрения — habr.com
- GLM-5: топ-1 открытая модель для генерации кода и текста, конкурирующая с Claude и GPT на агентных задачах — neurohive.io
- Полез в исходники vLLM, чтобы понять, почему один символ убивает prompt caching — habr.com