Новый процессор Snapdragon Reality Elite обещает мощный прирост для AR-устройств
Qualcomm анонсировала новый процессор Snapdragon Reality Elite, ориентированный на устройства дополненной реальности (AR). Графический ускоритель получил улучшение на 60%, что обеспечит значительный скачок производительности. Процессор был протестирован на новых очках Aura для Android XR, продемонстрировав потенциал нового поколения устройств. Хотя детали спецификаций официально не раскрыты, очевидно, что Qualcomm стремится занять лидирующие позиции в сегменте AR-чипов.
Источник: theverge.com
Prompt injection невозможно устранить: год уязвимостей и проблемы безопасности
Prompt injection продолжает оставаться серьёзной угрозой для экосистемы AI. История заражения пакета LiteLLM на PyPI показала масштабы риска: бот hackerbot-claw заразил тысячи установок, демонстрируя способность распространяться автоматически без участия человека. Проблема заключается в том, что подобные атаки легко воспроизводимы и требуют минимальных усилий для реализации. Несмотря на попытки патчей, риск prompt injection остается высоким и требует комплексного подхода к защите.
Источник: habr.com
Индекс качества AI-агентов: лучшие справляются только с третьими реальной работы
Новый бенчмарк ClawBench показал, что даже самый сильный AI-агент справляется менее чем с третью реальных повседневных задач интернета. Например, бронирование рейса, отклик на вакансию или оформление заказа оказались сложными испытаниями для современных агентов. Эти результаты контрастируют с показателями на традиционных бенчмарках, где эффективность достигает 65–75%.
Источник: neurohive.io
Ограниченный успех AI-агентов на бирже фриланса: выполнение только 2.5% реальных задач
Исследователи представили Remote Labor Index (RLI) — бенчмарк, оценивающий способности AI-агентов выполнять реальные проекты с бирж фриланса. Из 240 заданий, собранных с платформы Upwork, успешность выполнения оказалась крайне низкой — всего 2.5%. Даже самые передовые модели не способны заменить человеческий труд в широком спектре задач.
Источник: neurohive.io
Доля ChatGPT падает ниже 50%: усиление конкуренции на рынке AI-ассистентов
Доля ChatGPT на рынке AI-ассистентов снизилась ниже 50%, согласно отчету Sensor Tower. Основные соперники — Gemini с 27,7% и Claude с 10,3%. Несмотря на сохранение лидерства по количеству пользователей, снижение доли отражает изменения предпочтений потребителей и усиление конкурентов.
Источник: ixbt.com
Исследование: роль AI в ролевых играх ограничена, особенно в отыгрыше отрицательных персонажей
Исследование показало, что современные AI-модели плохо справляются с ролевой игрой, особенно когда речь идет о персонажах-злодеях. Средний балл для положительных героев составляет 3.21 из 5, а для отрицательных — всего 2.61. Основная причина — сложность моделирования мотивации и эмоций, необходимых для убедительного исполнения роли.
Источник: neurohive.io
Разрыв между теоретическими и практическими показателями AI в детектировании аномалий
Многие научные статьи утверждают точность F1 близкую к 99% в задаче детектирования аномалий во временных рядах. Однако практические тесты показывают значительное расхождение. После исключения протокола Point Adjustment разница между заявленными и фактическими показателями достигла 47 процентных пунктов. Исследование также подчеркивает важность правильного подбора модели в зависимости от специфики данных и условий эксплуатации.
Источник: habr.com
Появился новый тип нейросетей размером всего 15 КБ с высокой точностью распознавания
Представлены два небольших нейросетевых проекта: тернарный KAN объемом 15.4 КБ с точностью 96.15% на наборе данных MNIST и система многошагового рассуждения VSA-Reasoner без использования крупных языковых моделей (LLM) с точностью 90%. Обе сети отличаются компактностью и эффективностью, работая исключительно на центральных процессорах (CPU).
Источник: habr.com