OpenAI представила ChatGPT Images 2.0 с улучшенным качеством и поддержкой мультиязычного текста
OpenAI официально объявила о релизе ChatGPT Images 2.0 на базе новой модели gpt-image-2. Согласно рейтингу LM Arena, эта версия значительно улучшилась по сравнению с конкурентами, заняв первое место во всех категориях генерации изображений. Улучшения включают идеальное отображение текста на различных языках и точное выполнение сложных инструкций. Теперь пользователи могут создавать высококачественные картинки разрешением до 2К пикселей с детальным описанием объектов и сцен.
Источник: neurohive.io
Google начал включать мнения экспертов с Reddit в результаты своего AI-поиска
Google объявил о новом этапе развития своей технологии AI-поиска, добавив возможность получать экспертные советы прямо из обсуждений на платформах вроде Reddit. Эта функция позволяет пользователям находить рекомендации и отзывы реальных людей по интересующим вопросам. Таким образом, поисковик стремится улучшить качество выдачи, предлагая свежий взгляд на проблемы, ранее доступные только через специализированные форумы.
Источник: techcrunch.com
Anthropic привлекла инвестиции на сумму $1,5 миллиарда для расширения бизнеса
Компания Anthropic заключила соглашение с крупными инвестиционными фондами, такими как Blackstone, Goldman Sachs и Hellman & Friedman, получив финансирование в размере $1,5 миллиардов. Эти средства будут направлены на развитие новых направлений деятельности, связанных с предоставлением услуг корпоративному сектору. Компания планирует создать аналогичную структуру, как у OpenAI, с целью конкуренции за крупные контракты с предприятиями.
Источник: ai-stat.ru
Новый стандарт тестирования ИИ-агентов показывает слабые стороны современных технологий
Исследовательская группа разработала новый бенчмарк ClawBench, предназначенный для проверки способности ИИ-агентов решать реальные повседневные задачи в сети Интернет. Лучшая модель, протестированная на этом бенчмарке, смогла справиться только с 33% предложенных заданий. Этот результат контрастирует с показателями на стандартных тестах, где успех достигает 65–75%.
Источник: neurohive.io
Новая модель GLM-5 стала лидером открытых LLM по качеству генерации текста и кода
Китайские исследователи представили открытую языковую модель GLM-5, которая занимает лидирующие позиции по ряду ключевых метрик качества. Она превосходит другие открытые модели на бенчмарках Artifical Analysis и LMArena, демонстрируя высокие показатели в генерации текста и программного кода. GLM-5 способна эффективно справляться с агентскими задачами и уверенно конкурирует с коммерческими моделями, такими как Claude и GPT.
Источник: neurohive.io
Крупнейшие ИИ-агенты смогли решить только 2,5% реальных задач с бирж фриланса
Команда специалистов из Центра безопасности ИИ и компании Scale AI провела исследование, которое показало, насколько современные ИИ-агенты далеки от реальной продуктивности. Создав бенчмарк Remote Labor Index (RLI), они оценили способность агентов выполнять типичные задачи с платформы Upwork. Даже лучшие представители индустрии справлялись менее чем с 3% поставленных перед ними задач.
Источник: neurohive.io
Искусственный интеллект плохо играет роль злодея в ролевых играх
Группа китайских учёных изучила, как современные языковые модели справляются с ролевой игрой, особенно когда речь идёт о персонажах-злодеях. Исследование показало, что даже для положительных героев уровень успеха остаётся низким — около 3,21 из 5 возможных баллов. Однако для отрицательных ролей оценки оказались ещё ниже — примерно 2,61. Причиной стало отсутствие необходимых навыков моделирования поведения антагонистов.
Источник: neurohive.io
Google Chrome автоматически скачивает 4-гигабайтную ИИ-модель без уведомления пользователя
Некоторые пользователи заметили, что последняя версия Google Chrome незаметно загружает огромный файл весом 4 гигабайта, связанный с моделью искусственного интеллекта Gemini Nano. Этот файл необходим для работы ряда встроенных функций, таких как защита от мошенничества и автозаполнение форм. Проблема заключается в том, что установка происходит без явного разрешения пользователя, а удаление файла может привести к его автоматической перезагрузке позже.
Источник: ixbt.com