TerinarKAN предложил радикальное сокращение параметров нейросети до 1.58 бит, заменив привычные линейные веса обучаемой функцией. Несмотря на опасения о падении точности ниже четырёх бит, практика показала обратное: тернарные сети сохраняют качество работы. Этот подход открывает путь к уменьшению размеров моделей без потерь производительности . Новый бенчмарк ClawBench выявил серьёзную проблему: лучшие AI-агенты способны решить лишь треть реальных повседневных задач. Например, даже сильный Claude Sonnet 4.6 завершил только 33% заданий вроде бронирования рейса или отклика на вакансию. Это контрастирует с традиционными бенчмарками, где показатели достигают 65–75% . Исследователи из Центра безопасности AI обнаружили, что даже лидеры рынка справляются менее чем с тремя процентами реальных задач с бирж фриланса. Из 240 проектов с платформы Upwork только 2.5% выполнены ИИ на удовлетворительном уровне. Это ставит вопрос о готовности агентов к настоящей рабочей нагрузке . Linux продолжает удивлять: разработчики адаптировали драйверы для видеокарт возрастом в двадцать лет, используя технологии искусственного интеллекта. Эта инициатива позволяет пользователям продолжать использовать старое оборудование, поддерживая совместимость с современными версиями операционной системы . Эти новости формируют картину сегодняшнего утра в мире AI: инновационные подходы к сокращению параметров нейросетей, проблемы интеграции AI-агентов в реальную жизнь и необходимость адаптации технологий для устаревшего оборудования.
Источники
- Тернарный KAN: не баг, а фича — почему дискретные веса работают лучше — habr.com
- ClawBench: лучший ИИ-агент смог успешно завершить только 33% реальных повседневных задач — neurohive.io
- Remote Labor Index: ведущие ИИ-агенты справились с 2.5% реальных задач с биржи фрилансеров — neurohive.io
- Как ИИ помогает Linux возвращать к жизни двадцатилетние видеокарты — habr.com