OpenAI представила ChatGPT Images 2.0 с улучшенной генерацией изображений
OpenAI анонсировала новую версию своей системы генерации изображений — ChatGPT Images 2.0. Новая модель получила значительное улучшение качества рендеринга текста на нескольких языках и точное следование сложным инструкциям. Согласно рейтингу LM Arena, она набрала рекордные баллы, опередив ближайших конкурентов на 242 пункта Elo. Среди ключевых особенностей — поддержка разрешения до 2K и возможность обработки мультиязычного текста.
Источник: neurohive.io
Anthropic увеличил лимиты для подписчиков Claude Code
Разработчики, сталкивавшиеся с ограничениями производительности Claude Code, получили хорошие новости. Компания Anthropic удвоила пятичасовые лимиты для подписок Pro, Max, Team и enterprise-тарифов. Дополнительно сняты ограничения пиковых часов для Pro и Max, ранее снижавшихся на 30-50% в периоды перегрузок. Изменения вступили в силу немедленно, без ожидания в очереди.
Источник: ai-stat.ru
GLM-5 лидирует среди открытых LLM по качеству генерации текста и кода
Zhipu AI и Tsinghua University представили GLM-5 — открытую языковую модель, ставшую первой среди бесплатных аналогов по ряду бенчмарков. Она занимает первую позицию среди open-weight моделей на Artificial Analysis и лидирует в генерации кода и текста на LMArena. Модель также показывает лучшие результаты на BrowseComp и Human Language Evaluation (HLE) с использованием инструментов.
Источник: neurohive.io
Исследование: киберпреступники редко применяют ИИ-инструменты массово
Исследование, проведённое учёными из университетов Великобритании, показало, что преступники слабо интегрируют ИИ-технологии в свою деятельность. Несмотря на появление мощных моделей типа ChatGPT, большинство участников теневых рынков продолжают использовать традиционные методы автоматизации. Лишь опытные пользователи применяют ИИ для специфичных задач, таких как маскировка следов активности.
Источник: ixbt.com
ClawBench показал низкую эффективность ИИ-агентов в реальных сценариях
Исследователи создали новый бенчмарк ClawBench, имитирующий выполнение повседневных задач через интернет. Лучшая модель — Claude Sonnet 4.6 — смогла решить только треть предложенных заданий. Этот показатель значительно отличается от результатов на стандартных бенчмарках, где ИИ-агенты достигают эффективности 65-75%.
Источник: neurohive.io
NVIDIA вложила $40 млрд в сделки с компаниями экосистемы AI
NVIDIA продолжает активно инвестировать в развитие AI-экосистемы. За этот год компания заключила сделок на общую сумму $40 миллиардов. Эти инвестиции направлены на поддержку стартапов и технологических лидеров, работающих над развитием технологий искусственного интеллекта.
Источник: techcrunch.com
Удалённые работники оценили производительность ведущих ИИ-агентов
Команда исследователей из Центра безопасности AI и Scale AI провела оценку способности ИИ-агентов решать реальные задачи удалённой работы. Из 240 реальных заказов с платформы Upwork успешными оказались лишь 2.5% решений. Даже самые передовые модели демонстрируют крайне низкий уровень выполнения практических задач.
Источник: neurohive.io
Claude Code предпочитает HTML вместо Markdown для вывода сложных файлов
Markdown давно является стандартом для взаимодействия с AI-агентами, однако разработчики сталкиваются с проблемами масштабирования. Автор материала делится опытом перехода на HTML как основной формат вывода. HTML позволяет создавать визуально привлекательные страницы, добавлять цветовую разметку и упрощает обмен файлами. Эта практика особенно полезна при создании крупных документов или спецификаций.
Источник: habr.com