OpenAI улучшила свою модель генерации изображений, представив ChatGPT Images 2.0. Новая версия поддерживает высокое разрешение 2K и способна точно следовать сложным инструкциям, отображая текст на разных языках. Сразу после релиза модель вышла на первое место в рейтинге LM Arena, обогнав конкурентов на 242 балла Elo . Gemini занял первую позицию в научной сфере, набрав 94.3% на бенчмарке GPQA Diamond. Его преимущество — обработка целых исследовательских корпусов благодаря контекстному окну размером 1 миллион токенов. Модель также интегрирована с Google Scholar и обычным веб-поиском, что упрощает научные изыскания . Тем временем исследователи из Центра безопасности AI и Scale AI провели оценку способности ИИ-агентов справляться с реальной работой фрилансеров. Их бенчмарк Remote Labor Index показал, что даже самые современные модели способны решить лишь 2.5% реальных задач с бирж фриланса . Google продолжает трансформацию своего поисковика, внедряя AI-агентов и новые модели серии Gemini. Однако пользователи недовольны изменениями, предпочитая классические результаты поиска. Инсталляции альтернативного поисковика DuckDuckGo увеличились на 30% после обновления Google Search .
Источники
- ChatGPT Images 2.0: OpenAI запустила обновление модели генерации изображений с рассуждениям, 2K-разрешением и мультиязычным текстом — neurohive.io
- Какую AI-модель выбрать в 2026: Claude, GPT или Gemini — ai-stat.ru
- Remote Labor Index: ведущие ИИ-агенты справились с 2.5% реальных задач с биржи фрилансеров — neurohive.io
- DuckDuckGo installs are up 30% as users reject being ‘force-fed’ Google’s AI Search — techcrunch.com