Что это
Wan (полное название — Tongyi Wanxiang, 通义万相) — это семейство нейросетей от Alibaba для генерации видео и изображений. Часть большой AI-платформы Tongyi, куда также входит модель Qwen для текста. С 2024 года компания публикует открытые версии моделей — веса можно скачать с HuggingFace и запустить локально, что принципиально отличает Wan от Sora, Runway и Kling.
Ключевое отличие — в Wan 2.2 впервые в индустрии видеогенерации применена архитектура MoE (Mixture of Experts). Это снижает нагрузку на видеокарту: 14B-модель работает на одной потребительской видеокарте с 22 ГБ VRAM и генерирует 5-секундное 720p-видео за несколько минут.
Ключевые возможности
- Text-to-video — генерация видео из текстового описания (до 5-15 секунд в последних версиях)
- Image-to-video — анимация статичной картинки
- Генерация изображений высокого качества (отдельная модель Wan-Image)
- Поддержка китайского и английского языка в промптах
- В версии 2.6 добавлен контроль персонажей и мультисцен до 15 секунд
- В версии 2.7 (апрель 2026) появился Thinking Mode — модель планирует сцену перед генерацией
- Липсинк и видео с цифровыми аватарами в поздних версиях (Wan-Animate)
- Открытые веса младших моделей — можно дообучать под свой стиль
Тарифы
Облачный сервис (tongyi.aliyun.com/wan) работает по модели оплаты за генерации. Точные цены зависят от версии модели и разрешения видео, оплата через Alibaba Cloud или через встроенный кошелёк на сайте Tongyi.
API через Alibaba Cloud Model Studio (DashScope) — pay-as-you-go, тарификация за запрос. Подходит для интеграции в свой продукт.
Open-source версии (Wan 2.1 1.3B и 14B, Wan 2.2 MoE, Wan 2.2-Animate) — бесплатны. Скачать можно с HuggingFace или ModelScope. Нужна видеокарта с 8-24 ГБ VRAM в зависимости от модели.
Сторонние хостинги — fal.ai, Replicate, monet.vision и другие агрегаторы предоставляют доступ к Wan через удобный веб-интерфейс с оплатой за генерации.
Плюсы и минусы
Плюсы: open-source альтернатива платным западным сервисам, высокое качество видео на уровне лидеров рынка, возможность запуска локально, быстрое развитие (Wan 2.2 → 2.6 → 2.7 менее чем за год), поддержка китайского языка лучше большинства конкурентов, гибкость через дообучение
Минусы: интерфейс официального сайта на китайском, регистрация и оплата из России требуют обходных путей (виртуальные карты, агрегаторы), локальный запуск требует мощной видеокарты, документация в основном на китайском
Кому подходит
Видеомонтажёрам и контент-мейкерам которым нужна открытая альтернатива Sora и Runway. Разработчикам которые хотят встроить видеогенерацию в свой продукт через API. Энтузиастам с мощным ПК которые хотят запустить модель локально. Компаниям с ограничениями на использование западных AI-сервисов.
Для российских пользователей есть подробный гайд: Как зарегистрироваться и оплатить Wan из России