Skip to main content
HappyHorse 1.0

HappyHorse — открытая генерация видео ИИ, переосмысленная

HappyHorse 1.0 — официальная открытая модель генерации видео команды Happy Horse: унифицированный Transformer на 15 млрд параметров, совместно создающий видео и синхронизированный звук из текста или изображений, с кинематографическим качеством 1080p и синхронизацией губ на семи языках.

15B
Параметры
40
Слои Transformer
38 с
5 с @ 1080p на H100
7
Языки lip-sync

Happy Horse в действии

Примеры клипов от Happy Horse 1.0 — нажмите для воспроизведения.

Сцена sci-fi

"Робот танцует на Луне на фоне Земли"

Природа

"Старик на вершине горы смотрит на долину"

Город

"Киберпанк-улица ночью с неоном"

Все образцы — клипы 1080p 5–8 с, созданные Happy Horse 1.0

Ключевые возможности HappyHorse

Унифицированная мультимодальная архитектура для совместной генерации видео и аудио.

Унифицированный Transformer

40 слоёв self-attention, по 4 модально-специфичных слоя с каждого конца и 32 общих слоя.

Совместное видео + аудио

Синхронный диалог, фон и фoley вместе с кадрами.

Дистилляция DMD-2 за 8 шагов

Шумоподавление за 8 шагов без classifier-free guidance.

Многоязычная синхронизация губ

Английский, мандарин, кантонский, японский, корейский, немецкий, французский.

Вывод 1080p

Клипы 5–8 с в 1080p, соотношения 16:9 и 9:16.

Открыто и self-hosted

Базовая и дистиллированная модели, суперразрешение и код инференса с коммерческой лицензией.

Бенчмарки и производительность HappyHorse

По 2000 сравнениям с участием людей Happy Horse 1.0 лидирует по визуальному качеству, соответствию промпту и физической правдоподобности с наименьшим WER среди открытых конкурентов. Мировой #1 на Artificial Analysis Video Arena, Elo 1333.

Модель Визуал Соответствие Физика WER (%)
OVI 1.1 4.73 4.10 4.41 40.45
LTX 2.3 4.76 4.12 4.56 19.23
Happy Horse 1.0 #1 4.80 4.18 4.52 14.60

Доля побед: 80.0% vs OVI 1.1 · 60.9% vs LTX 2.3

Сравнение с другими моделями

Позиция Happy Horse 1.0 среди ведущих видеомоделей ИИ 2026 года.

Модель Разработчик Параметры Входы Лицензия
Happy Horse 1.0 Happy Horse Team ~15B Text / Image Открытая + коммерция
Seedance 2.0 ByteDance Seed Undisclosed Text / Image / Audio / Video Проприетарная
Ovi 1.1 Character AI & Yale ~11B Text (Image opt.) Открытый код
LTX 2.3 Lightricks 22B Text / Image / Video / Audio Открытый код
Открытая + коммерция
Открытый код
Проприетарная

Развёртывание HappyHorse 1.0

Happy Horse 1.0 работает на мощных GPU NVIDIA H100 или A100 (рекомендуется ≥48 ГБ VRAM). FP8-квантование и 8-шаговый дистиллят снижают память при одной GPU.

Bash
# Clone & install
git clone https://github.com/happy-horse/happyhorse-1.git
cd happyhorse-1
pip install -r requirements.txt

# Download weights
bash download_weights.sh

# Generate
python demo_generate.py --prompt "a robot dancing on the moon" --duration 5
Python
from happyhorse import HappyHorseModel

model = HappyHorseModel.from_pretrained("happy-horse/happyhorse-1.0")

video, audio = model.generate(
    prompt="an elder on a mountain peak overlooking the valley",
    duration_seconds=5,
    fps=24,
    language="en",
)

video.save("output.mp4")
audio.save("output.wav")

Память GPU

≥48 ГБ VRAM (H100/A100)

Скорость генерации

~38 с для клипа 5 с на H100

Оптимизация

FP8 + 8 шагов

Создано исследователями, выбрано создателями

HappyHorse публикует и поддерживает исследовательская команда HappyHorse с прозрачным отчётом об архитектуре, обучении, дистилляции, протоколах бенчмарков и ограничениях. Воспроизводимый код инференса и ответственный выпуск генеративного видео.

Экспертиза

Авторы работают с мультимодальными Transformer, дистилляцией диффузии и крупномасштабным пре-трейнингом видео.

Прозрачность

Открытые веса, код инференса и методология бенчмарков — проверяемы независимыми исследователями.

Ответственность

Происхождение контента, водяные знаки, модерация downstream. Ожидается соблюдение норм ИИ.

Частые вопросы

Ответы о Happy Horse 1.0.

Что такое Happy Horse 1.0?
Открытая 15B-модель, совместно генерирующая видео и синхронизированный звук из текста или изображений.
Можно ли в коммерции бесплатно?
Да. Базовая и дистиллированная модели, суперразрешение и код инференса с коммерческими правами.
Какое железо нужно?
Рекомендуется NVIDIA H100 или A100 с ≥48 ГБ VRAM. ~38 с на клип 5 с 1080p на H100.
Какие языки lip-sync?
Семь: английский, мандарин, кантонский, японский, корейский, немецкий, французский — низкий WER.
Сравнение с OVI и LTX?
Happy Horse 1.0 превосходит OVI 1.1 (80,0% побед) и LTX 2.3 (60,9%) по качеству, соответствию промпту и WER.

Ещё вопросы? Создать issue на GitHub