Российское правительство пересмотрело проект закона об искусственном интеллекте
Правительство России одобрило обновлённую версию проекта закона об искусственном интеллекте. Документ кардинально отличается от предыдущей редакции марта 2026 года. Вместо жёстких ограничений и контроля предложены меры поддержки развития отрасли. Изменения касаются разработки, внедрения и эксплуатации решений на основе ИИ. Практические последствия для разработчиков и бизнеса пока уточняются.
Источник: habr.com
ClawBench: лучшие ИИ-агенты завершают только треть реальных задач
Новый бенчмарк ClawBench оценивает способность ИИ-агентов решать повседневные задачи вроде бронирования рейсов или оформления заказов онлайн. Сильнейший участник — Claude Sonnet 4.6 — справился лишь с 33% заданий. Эти показатели значительно уступают результатам на стандартных бенчмарках, где успешность достигает 65–75%.
Источник: neurohive.io
GLM-5 — первая открытая модель, обошедшая GPT и Claude на агентских задачах
Исследовательская группа Zhipu AI представила GLM-5 — открытую языковую модель, ставшую лидером открытых моделей на бенчмарках Artificial Analysis и LMArena. Она также показала наилучшие результаты на задачах с использованием инструментов, опередив коммерческие аналоги GPT и Claude.
Источник: neurohive.io
Оптимизация инференса LLM в продакшене снижает расходы на сотни тысяч долларов
Оптимизация процесса инференса крупных языковых моделей (LLM) позволяет сократить затраты на несколько сотен тысяч долларов ежемесячно. Статья предлагает пошаговый гайд по настройке инференса, позволяющий снизить издержки без ущерба качеству результатов.
Источник: habr.com
Russian AI Researchers: рольвые игры выявляют слабости алгоритмов выравнивания
Исследование российских учёных показало, что крупные языковые модели плохо справляются с ролевой игрой, особенно когда нужно играть отрицательных героев. Средний балл за исполнение роли героя составил 3.21 из 5, а за злодейство — всего 2.61. Причиной называют недостаток специализированных алгоритмов выравнивания.
Источник: neurohive.io
VSA Reasoner решает 90% вопросов без LLM и GPU
Представлен первый обучаемый нейронный reasoner на архитектуре VSA (Vector Symbolic Architecture). Решение демонстрирует точность 90% в вопросах с несколькими этапами анализа. Потребляет всего 16 KB оперативной памяти и работает исключительно на центральном процессоре (CPU).
Источник: habr.com
Remote Labor Index: ИИ-агенты решили менее 3% реальных задач фриланса
Команда исследователей создала бенчмарк Remote Labor Index (RLI), протестировав способности ИИ-агентов выполнять реальные заказы с платформы Upwork. Даже лучшие модели смогли решить лишь 2.5% задач на достаточном уровне качества.
Источник: neurohive.io
Новый закон об ИИ меняет правила игры для разработчиков в России
Законодательство об искусственном интеллекте прошло важное обсуждение в правительстве России. Новая версия документа предполагает поддержку отрасли, отказавшись от ранее заявленных мер ограничения и контроля. Разработчики ожидают уточнения практических последствий нововведений.
Источник: habr.com