OpenAI запускает ChatGPT для личных финансов с доступом к банкам
Пользователи смогут подключить банковские счета к ChatGPT через платформу Plaid. Новый инструмент позволит видеть полную финансовую картину: состояние счетов, расходы, подписки, платежи. Сервис доступен в режиме предварительного просмотра. Сейчас ежемесячно ChatGPT посещают свыше 200 миллионов человек с вопросами о финансах.
Источник: theverge.com
Anthropic подорожал до $1 трлн на сером рынке
Один из ранних инвесторов Anthropic выставляет акции стартапа на продажу за $1,15 трлн. Оценка превышает любую известную оценку OpenAI ($880 млрд). Рост начался резко: еще в феврале оценка составляла $380 млрд. Сделки на сумму выше $960 млрд находят покупателей менее чем за сутки.
Источник: ai-stat.ru
AI-радиостанция провалилась за неделю вещания
Экспериментальная радиостанция, управляемая четырьмя популярными моделями AI (Claude, ChatGPT, Gemini, Grok), исчерпала стартовый капитал в размере $20 всего за несколько дней. Каждая модель должна была создать уникальный радиообраз и заработать деньги. Все попытки закончились неудачей.
Источник: theverge.com
Google обновил политику спама для попыток манипуляции AI
Google объявил, что будет считать попыткой спама любые усилия по влиянию на результаты поиска или генерационные ответы AI. Под запрет попадают такие методы, как предвзятые списки лучших продуктов («лучшие из») и отравление рекомендаций («poisoning»). Политика направлена на защиту пользователей от манипуляций.
Источник: theverge.com
Особый случай: антропоморфизация AI в статье о промпт-инжиниринге
Статья, написанная совместно человеком и моделью Claude Opus, представляет собой размышления AI о процессе взаимодействия с людьми. Автор публикует четыре инсайта, сформулированные моделью, подчеркивая эмоциональность изложения. Несмотря на необычный подход, статья вызвала интерес сообщества.
Источник: habr.com
Крупнейший поставщик SDK для AI переходит под контроль Anthropic
Компания Stainless, создающая SDK для OpenAI, Google и Anthropic, ведет переговоры о продаже своему клиенту Anthropic примерно за $300 млн. Stainless известен созданием инструментов, используемых всеми крупными игроками рынка. Покупка усилит позиции Anthropic в инфраструктуре разработки приложений для AI.
Источник: ai-stat.ru
Анализ безопасности ролевой игры с большими языковыми моделями
Исследование показывает, что современные LLM плохо справляются с ролевыми играми, получая средние баллы 3.21 из 5 для героев и 2.61 для злодеев. Основная причина — недостаточное понимание природы поведения персонажа. Работа важна для понимания ограничений современных моделей.
Источник: neurohive.io
Тестирование агентов на реальных задачах фриланса выявило низкую производительность
Исследования показали, что лучшие AI-агенты способны решить только 2.5% реальных задач с бирж фриланса. Использовались проекты с платформы Upwork, охватывающие широкий спектр деятельности. Результат подчеркивает разрыв между лабораторными показателями и реальной производительностью.
Источник: neurohive.io