Симуляция жизни для тренировки ИИ-агентов
Исследователи создали цифровую среду, похожую на игру The Sims, чтобы тренировать ИИ-агентов. Виртуальные персонажи ведут полноценную жизнь: работают, отдыхают, строят личные отношения. Цель эксперимента — создать реалистичную базу данных для обучения ИИ пониманию человеческих эмоций и поведения. До сих пор обучение ограничивалось статичными наборами данных, но новый подход обещает прорыв в развитии эмоционального интеллекта агентов.
Источник: habr.com
Ограничение доступа к моделям Anthropic Fable 5 и Mythos 5
Правительство США заблокировало доступ иностранных пользователей к моделям Fable 5 и Mythos 5 от Anthropic. Решение мотивировано соображениями национальной безопасности. Компания выполнила требование правительства, хотя детали угроз не были предоставлены публично. Представители Anthropic заявили, что уязвимости, выявленные правительством, незначительны и могли быть устранены иначе.
Источник: theverge.com
Новые фото-инструменты Apple с использованием AI
Apple представила первые нативные инструменты редактирования фотографий с помощью AI в новой версии iOS 27. Эти функции позволяют значительно улучшить качество снимков прямо в приложении Photos. Хотя функциональность пока скромнее аналогов на Android, нововведения знаменуют важный этап интеграции AI в стандартное ПО iPhone.
Источник: theverge.com
Специализация AI-моделей в 2026 году
Сравнение современных AI-моделей показало отсутствие единого лидера. Каждая модель специализируется на конкретных задачах: Grok лидирует в разработке программного обеспечения, Gemini — в аналитике и исследованиях, Claude — в обработке больших документов. Пользователь выбирает модель исходя из типа решаемой задачи, а не абстрактного рейтинга производительности.
Источник: ai-stat.ru
Запрет доступа к Anthropic связан с обращением Amazon
По сообщениям Wall Street Journal, решение администрации США ограничить доступ к моделям Anthropic стало результатом сигналов от Amazon. Глава компании Энди Джесси предупредил правительство о потенциальной опасности, связанной с возможностью получения конфиденциальной информации через запросы к модели Fable 5. После проверки выводов Amazon власти приняли меры по защите национальных интересов.
Источник: ixbt.com
Оценка эффективности AI-агентов на бирже труда
Новый бенчмарк Remote Labor Index показал, что лучшие AI-агенты способны решить только 2.5% реальных задач с платформы Upwork. Исследователи протестировали 240 заданий различных категорий, от дизайна до программирования. Даже самые мощные модели оказались неэффективны вне лабораторных условий, подчеркивая необходимость дальнейшего развития специализированных инструментов.
Источник: neurohive.io
Анализ роли человеческого фактора в развитии AI
Boeing опубликовал данные, согласно которым большинство авиакатастроф связано с ошибками человека, несмотря на улучшение надежности техники и внедрение автоматики. Этот парадокс иллюстрирует важность учета человеческого фактора при внедрении новых технологий, особенно в области искусственного интеллекта.
Источник: habr.com
Тестирование возможностей крупных языковых моделей в ролевых играх
Группа китайских ученых провела исследование, изучающее способность больших языковых моделей играть разные роли. Эксперимент показал, что даже специализированные модели демонстрируют слабые результаты в ролевой игре, особенно при исполнении отрицательных ролей. Средний результат составил 3.21 из 5 баллов для положительных героев и 2.61 для антагонистов.
Источник: neurohive.io