Claude Sonnet 5 сравнялся с Opus 4.8 по агентским задачам
Anthropic обновила линейку Claude, выпустив Sonnet 5. Новая версия ориентирована на агентные задачи: планирование, работа с инструментами, программирование и автономное выполнение последовательностей шагов. Улучшения позволяют ей вплотную подойти к показателям гораздо более дорогого Opus 4.8.
Sonnet 5 сохраняет доступность бесплатной версии и привлекает внимание специалистов, которым важны бюджетные решения для автоматизации рабочих процессов.
Источник: neurohive.io
GLM-5 стала первой открытой моделью-лидером на агентных задачах
Zhipu AI и Tsinghua University представили GLM-5 — открытую модель, которая обошла конкурентов на ключевых бенчмарках. GLM-5 занимает первые места среди открытых моделей на Artificial Analysis и LMArena, лидируя также на BrowseComp и HLE с использованием внешних инструментов.
Модель способна не только отвечать на запросы, но и самостоятельно инициировать цепочку действий для достижения цели, приближаясь по эффективности к коммерческим продуктам вроде Claude и GPT.
Источник: neurohive.io
Google Gemini добавил поддержку MacOS для ассистента Gemini Spark
Google выпустил версию своего круглосуточного ассистента Gemini Spark для macOS. Теперь пользователи Apple могут пользоваться возможностями агента: отслеживание событий в режиме реального времени, поддержка большего числа приложений и интеграций. Ассистент продолжает развитие функционала, расширяя аудиторию за счет платформы Mac.
Источник: techcrunch.com
Яндекс отказался принимать дипломы юристов, созданные с помощью ИИ
Сочинский филиал РУДН объявил об отказе от написания дипломных работ студентами-юристами из-за риска злоупотребления искусственным интеллектом. Решение мотивируется опасениями, связанными с качеством и оригинальностью работ, созданных с участием ИИ-технологий. Этот шаг подчеркивает необходимость адаптации образовательных стандартов к новым технологиям.
Источник: iz.ru
Min Prosvescheniya запускает акцию красивых номеров для отличников ЕГЭ
Минпросвещения совместно с оператором Yota объявило акцию для выпускников, набравших максимальные баллы на ЕГЭ. Отличникам будут предоставлены уникальные мобильные номера формата «555». Акция направлена на поощрение высоких достижений школьников и привлечение внимания к успехам лучших учеников страны.
Источник: ixbt.com
Смарт-очки Blackview BV100 предлагают камеру, AI-ассистент и наушники за ₽5 тыс.
Blackview анонсировала доступные смарт-очки BV100 стоимостью около ₽5 тысяч. Устройство оснащено камерой, встроенным голосовым помощником и беспроводными наушниками. Очки позиционируются как альтернатива премиальным устройствам типа Meta Ray-Ban, предлагая широкий функционал по доступной цене.
Источник: habr.com
Исследование показало, что лучшие ИИ-агенты выполняют только треть реальных задач
Исследовательский бенчмарк ClawBench выявил ограниченные способности современных ИИ-агентов решать реальные повседневные задачи. Даже самая продвинутая модель — Claude Sonnet 4.6 — смогла справиться лишь с 33% заданий, таких как бронирование рейса или оформление заказа онлайн. Эти результаты контрастируют с показателями на стандартных бенчмарках, где ИИ достигает успеха в 65–75%.
Источник: neurohive.io
Oracle сократил 30 тыс. сотрудников ради инвестиций в ИИ-инфраструктуру
Oracle провел масштабные сокращения персонала, освободив ресурсы для финансирования развития технологий искусственного интеллекта. Компания направляет инвестиции в создание новых дата-центров и разработку решений на основе ИИ. Сокращения затронули около 30 тысяч человек, позволяя ежегодно экономить до $12 миллиардов, необходимых для реализации стратегии цифровизации бизнеса.
Источник: habr.com