Главные события недели
OpenAI запустила ChatGPT Images 2.0
Новая версия генератора изображений заняла первые места в рейтинге LM Arena, обогнав конкурентов на 242 балла Elo. Ключевые особенности: поддержка мультиязычного текста, выполнение сложных инструкций и разрешение до 2K.
Google столкнулся с критикой алгоритма поиска
Пользователи сообщают, что новый AI-поиск часто игнорирует специфические запросы, предлагая общие ответы. Это вызвало недовольство среди тех, кто привык к точной выдаче результатов.
Исследование ClawBench выявило низкую эффективность AI-агентов
Лучшие AI-агенты справляются лишь с третью практических задач вроде бронирования рейсов или откликов на вакансии. Разрыв между показателями на синтетических и реальных бенчмарках подчеркивает необходимость пересмотра оценки эффективности моделей.
Новые инструменты и обновления
Zero-кодовый язык программирования Zero от Vercel Labs
Позиционирован как инструмент для разработки агентов, однако уже отмечаются недостатки, включая отсутствие поддержки ряда функций и совместимости с существующими системами.
Подводный дата-центр Китая
Первый в мире подводный дата-центр мощностью 24 МВт открыт у берегов Шанхая. Оснащён 2000 серверами, включая GPU для задач AI, охлаждение морской водой и интеграция с оффшорными ветровыми станциями.
Ограничение доступа к китайской нейросети DeepSeek в России
Российские пользователи столкнулись с невозможностью открытия платформы без использования VPN. Основная проблема связана с разрывом сессий на этапе TLS-рукопожатия.
Тренды
Оценка эффективности AI-агентов в реальных сценариях
Исследование ClawBench продемонстрировало значительный разрыв между результатами на синтетических и реальных бенчмарках. Это направление становится ключевым для понимания истинной полезности AI-моделей.
Универсализация моделей для работы с разными типами данных
Gemini Omni от Google способен одновременно обрабатывать текст, изображения, звук и видео, заменяя собой целый набор специализированных инструментов.
Повышение качества генерации изображений
Обновлённая версия ChatGPT Images 2.0 демонстрирует значительное улучшение качества визуализации текста и способности следовать детальным инструкциям.
На что обратить внимание
Дальнейшее развитие ChatGPT Images
Стоит следить за отзывами пользователей и новыми кейсами применения технологии, чтобы оценить её потенциал в коммерческих проектах.
Реакция Google на критику поиска
Компания может представить новые решения для улучшения релевантности выдачи, особенно в части обработки специфичных запросов.
Оценка AI-агентов в реальных условиях
Тренд на тестирование моделей в повседневной деятельности будет продолжаться, что позволит точнее оценивать их реальную пользу и области применения.