ChatGPT становится супер-приложением: самостоятельное выполнение задач
OpenAI анонсировала масштабное обновление ChatGPT, превратив сервис из простого чат-бота в полноценный помощник, выполняющий разнообразные задачи автоматически. Новая версия позволит боту не только отвечать на запросы, но и действовать от лица пользователя: бронировать билеты, планировать расписание, помогать в разработке и повседневных вопросах. Ключевое нововведение — глубокая интеграция с Codex, системой для автоматизации написания кода. Первые изменения ожидаются в ближайшее время.
Источник: ixbt.com
Новый уровень безопасности: OpenAI представила режим блокировки данных
OpenAI добавила функцию Lockdown Mode для защиты конфиденциальной информации от атак с использованием инъекционных промтов. Несмотря на наличие режима, вероятность утечки данных сохраняется, однако цель функции — минимизировать риски распространения чувствительных сведений. Новшество полезно компаниям и пользователям, работающим с секретными материалами.
Источник: techcrunch.com
Российские гиганты внедряют генеративный ИИ в транспортную отрасль
Аэрофлот и Сбербанк объявили о сотрудничестве по созданию решений на основе генеративного ИИ для транспорта. Компании планируют интегрировать инновационные технологии в управление транспортом, оптимизацию маршрутов и повышение эффективности перевозок. Соглашение подписано в ходе Петербургского международного экономического форума.
Источник: finam.ru
ИИ-агенты справляются только с четвертью реальных рабочих задач
Исследователи представили бенчмарк Remote Labor Index, демонстрирующий низкую эффективность современных ИИ-агентов при выполнении реальных заданий фрилансеров. Из 240 проверенных задач, взятых с платформы Upwork, ИИ удалось качественно выполнить лишь 2,5%. Исследование подчеркивает необходимость дальнейшего развития агентов для выполнения практических задач.
Источник: neurohive.io
GLM-5: первая открытая модель, превосходящая закрытые аналоги
Китайская команда Zhipu AI и университет Цинхуа выпустили открытую языковую модель GLM-5, ставшую лидером открытых моделей по ряду тестов. Она занимает первую позицию среди free-access моделей на бенчмарке LMArena и демонстрирует высокие результаты в генерации текста и кода. Модель способна решать комплексные задачи и обрабатывать инструкции с высокой точностью.
Источник: neurohive.io
Агенты OpenClaw vs Hermes: переезд с граблями
Автор делится опытом переноса личного агента с платформы OpenClaw на опенсорсный self-hosted Hermes. Перенос занял пол-года и сопровождался множеством ошибок, которые автор подробно описал. Статья полезна разработчикам и пользователям, планирующим миграцию агентов на другие платформы.
Источник: habr.com
Метаноловый прорыв: искусственное растение генерирует жидкое топливо
Ученые из Йеля разработали устройство, имитирующее природный фотосинтез растений, но производящее не органическое вещество, а жидкий метанол. Устройство способно перерабатывать солнечную энергию непосредственно в жидкое топливо без подключения к внешним источникам энергии. Технология обещает стать эффективной альтернативой традиционным аккумуляторам и пригодится в труднодоступных регионах.
Источник: ixbt.com
Герои и злодеи: как ИИ играет роли?
Исследование показало, что крупные языковые модели плохо справляются с ролевой игрой, особенно в исполнении отрицательных ролей. Средний рейтинг героев составил 3.21 из 5, а злодеев — еще ниже, около 2.61. Проблема связана с ограничениями этического выравнивания моделей, затрудняющими реалистичное отыгрывание сложных характеров.
Источник: neurohive.io