🌐 Искусственный интеллект выходит на новые рубежи: свежие достижения и тренды
Опубликована информация о новом релизе Claude Opus 4.7, представленного компанией Anthropic. Новая версия модели показала впечатляющий результат на бенчмарке SWE-Bench Pro, закрывая реальные тикеты GitHub лучше предыдущих версий и конкурентов. Показатель успешности составил 64,3%, что является значительным улучшением относительно версии Opus 4.6 (+10,9%). Среди главных нововведений выделяются улучшения в кодинговых и агентских сценариях, благодаря которым модель показывает высокую эффективность в выполнении практических задач. Стоимость использования осталась прежней ($5 за миллион входных токенов и $25 за выходные), что делает модель доступной широкому кругу пользователей.
OpenAI анонсировала новую модель GPT-Rosalind, ориентированную на область биологии и медицины. Модель названа в честь Розалинды Франклин, известной исследовательницы ДНК, чья работа сыграла ключевую роль в открытии двойной спирали. GPT-Rosalind представляет собой специализированную версию GPT-5.4, адаптированную для работы с научными данными и биоинформатическими задачами. Благодаря этому модель способна эффективно обрабатывать научные публикации, последовательности ДНК и белки, повышая точность анализа и прогнозирования в области биомедицины.
Модель GLM-5 стала лидером среди открытых моделей по результатам бенчмарков, демонстрируя высокие показатели эффективности в генерации кода и текста. Разработанная командой Zhipu AI и Университета Цзяотун, модель заняла первое место в рейтинге на платформах Artificial Analysis и LMArena, показав отличные результаты на задачах по обработке текста и созданию программного обеспечения. GLM-5 обладает уникальной архитектурой, позволяющей ей справляться с широким спектром задач, предлагая конкурентные решения в условиях открытого доступа.
Китайские исследователи провели исследование, сравнившее способности различных нейросетей в торговле акциями на реальных биржевых данных. Тестирование проводилось на индексе Dow Jones, где ИИ-агенты управляли портфелем из 20 акций в течение четырех месяцев. Лучшие результаты продемонстрировали модели Kimi-K2 и Qwen3-235B, которые показали стабильную прибыль и эффективное управление инвестициями. Исследование подчеркивает важность разработки специализированных решений для финансовых рынков, способных учитывать специфику биржевых процессов.
Источник: ai-stat.ru
💡 Как искусственный интеллект меняет рынок труда и экономику
Финансовая аналитика отмечает тревожную тенденцию сокращения рабочих мест вследствие внедрения искусственного интеллекта. Согласно исследованию, проведенному GS, ежегодно число сотрудников, замещаемых алгоритмами, достигает 192 тысяч человек. Прогнозируется дальнейшее увеличение числа увольнений, связанных с автоматизацией, особенно в ближайшие годы. Эксперты предупреждают, что снижение количества покупателей, вызванное потерей рабочих мест, приведет к замедлению экономического роста и снижению потребительского спроса.
Исследовательский проект Remote Labor Index показал низкую производительность ведущих ИИ-агентов на платформе фриланса Upwork. Только 2,5% выполненных заданий соответствовали стандартам качества, необходимым для реального выполнения профессиональных задач. Эти данные подчеркивают необходимость дальнейшего совершенствования возможностей ИИ для эффективного выполнения сложных и комплексных задач.
Источник: habr.com
📈 Инновационные стартапы и крупные игроки на рынке ИИ
ИИ-стартап Cursor привлек значительные инвестиции в размере $2 млрд при текущей оценке компании в $50 млрд. Рост выручки компании свидетельствует о быстром развитии сегмента AI-кодинга, конкурирующего с такими игроками, как Claude Code и Codex. Курсор планирует достичь уровня годовой выручки свыше $6 млрд к концу текущего года, увеличив свою долю на рынке.
Проект World, основанный бывшим руководителем OpenAI Сэмом Альтманом, продолжает расширять свое влияние. Сервис, использующий орбитальные устройства для верификации личности, стремится интегрироваться с различными компаниями, включая популярную платформу знакомств Tinder. Цель проекта заключается в повышении доверия пользователей путем подтверждения подлинности личности.
Источник: ixbt.com
🚀 Будущее искусственного интеллекта: вызовы и перспективы
Компания Anthropic возобновляет переговоры с администрацией Трампа после длительного конфликта, возникшего из-за ограничений на применение технологий ИИ в государственных структурах. Несмотря на недавние судебные разбирательства, отношения постепенно нормализуются, и компания рассматривает возможность возвращения к сотрудничеству с правительством США.
Отношения между Anthropic и администрацией Трампа демонстрируют признаки смягчения. После временного признания компании в статусе риска для цепочки поставок, наблюдается постепенное восстановление диалога между сторонами, что открывает перспективу возможного сотрудничества в будущем.
Эти новости отражают широкий спектр изменений и инноваций в индустрии искусственного интеллекта, затрагивающих различные аспекты экономики, бизнеса и общества.
Источник: ixbt.com