Skip to main content
HappyHorse 1.0

HappyHorse — Penjanaan video AI sumber terbuka, dibayangkan semula

HappyHorse 1.0 ialah model rasmi sumber terbuka penjanaan video pasukan Happy Horse — Transformer bersatu 15 bilion parameter yang bersama-sama menghasilkan video dan audio disegerak daripada teks atau imej, dengan kualiti sinematik 1080p dan segerak bibir tujuh bahasa.

15B
Parameter
40
Lapisan Transformer
38s
5s @ 1080p pada H100
7
Bahasa lip-sync

Lihat Happy Horse beraksi

Klip contoh dijana Happy Horse 1.0 — ketik untuk main.

Adegan sci-fi

"Robot menari di bulan dengan bumi di latar belakang"

Alam

"Warga emas di puncak gunung memandang lembah"

Bandar

"Jalan cyberpunk pada waktu malam dengan lampu neon"

Semua sampel ialah klip 1080p 5–8s dijana dengan Happy Horse 1.0

Keupayaan teras HappyHorse

Seni bina multimodal bersatu untuk penjanaan video dan audio bersama.

Transformer bersatu

Rangkaian self-attention 40 lapisan dengan 4 lapisan khusus modaliti di setiap hujung dan 32 lapisan dikongsi.

Video + audio bersama

Menjana dialog disegerak, bunyi persekitaran dan Foley bersama bingkai video.

Penyulingan DMD-2 8 langkah

Mengurangkan denoising kepada 8 langkah tanpa classifier-free guidance.

Segerak bibir pelbagai bahasa

Inggeris, Mandarin, Kantonis, Jepun, Korea, Jerman dan Perancis.

Output 1080p

Klip 5–8 saat pada 1080p, nisbah 16:9 dan 9:16.

Terbuka & self-hosted

Model asas, disuling, super-resolusi dan kod inferens dengan kebenaran komersial.

Penanda aras dan prestasi HappyHorse

Berdasarkan 2000 perbandingan dinilai manusia, Happy Horse 1.0 mendahului dalam kualiti visual, penjajaran prompt dan realisme fizikal dengan WER terendah dalam kalangan pesaing terbuka. Kedudukan #1 global di Artificial Analysis Video Arena, Elo 1333.

Model Visual Penjajaran Fizikal WER (%)
OVI 1.1 4.73 4.10 4.41 40.45
LTX 2.3 4.76 4.12 4.56 19.23
Happy Horse 1.0 #1 4.80 4.18 4.52 14.60

Kadar menang: 80.0% vs OVI 1.1 · 60.9% vs LTX 2.3

Bandingan dengan model lain

Kedudukan Happy Horse 1.0 berbanding model video AI terkemuka 2026.

Model Pembangun Parameter Input Lesen
Happy Horse 1.0 Happy Horse Team ~15B Text / Image Terbuka + komersial
Seedance 2.0 ByteDance Seed Undisclosed Text / Image / Audio / Video Proprietari
Ovi 1.1 Character AI & Yale ~11B Text (Image opt.) Sumber terbuka
LTX 2.3 Lightricks 22B Text / Image / Video / Audio Sumber terbuka
Terbuka + komersial
Sumber terbuka
Proprietari

Melaksanakan HappyHorse 1.0

Happy Horse 1.0 berjalan pada GPU berkuasa tinggi seperti NVIDIA H100 atau A100 (disyorkan ≥48 GB VRAM). Kuantisasi FP8 dan checkpoint disuling 8 langkah mengurangkan memori pada satu GPU.

Bash
# Clone & install
git clone https://github.com/happy-horse/happyhorse-1.git
cd happyhorse-1
pip install -r requirements.txt

# Download weights
bash download_weights.sh

# Generate
python demo_generate.py --prompt "a robot dancing on the moon" --duration 5
Python
from happyhorse import HappyHorseModel

model = HappyHorseModel.from_pretrained("happy-horse/happyhorse-1.0")

video, audio = model.generate(
    prompt="an elder on a mountain peak overlooking the valley",
    duration_seconds=5,
    fps=24,
    language="en",
)

video.save("output.mp4")
audio.save("output.wav")

Memori GPU

≥48 GB VRAM (H100/A100)

Kelajuan penjanaan

~38s untuk klip 5s pada H100

Pengoptimuman

Kuantisasi FP8 + 8 langkah

Dibina penyelidik, dipercayai pencipta

HappyHorse diterbitkan dan diselenggara oleh pasukan penyelidikan HappyHorse dengan laporan teknikal telus tentang seni bina, latihan, penyulingan, protokol penanda aras dan had yang diketahui. Kod inferens boleh diulang dan komitmen kepada pelepasan video generatif yang bertanggungjawab.

Kepakaran

Ditulis oleh pengamal Transformer multimodal, penyulingan resapan dan prapra latihan video berskala besar.

Ketelusan

Pemberat terbuka, kod inferens terbuka, metodologi penanda aras diterbitkan — boleh disahkan penyelidik bebas.

Tanggungjawab

Kami menyokong asal kandungan, penanda air dan moderasi hilir. Pematuhan peraturan AI dijangkakan.

Soalan lazim

Jawapan tentang Happy Horse 1.0.

Apakah Happy Horse 1.0?
Model sumber terbuka 15B yang bersama-sama menjana video dan audio disegerak daripada teks atau imej.
Percuma untuk komersial?
Ya. Termasuk model asas, disuling, super-resolusi dan kod inferens dengan hak komersial.
Perkakasan diperlukan?
Disyorkan NVIDIA H100 atau A100 dengan sekurang-kurangnya 48 GB VRAM. ~38s untuk klip 5s 1080p pada H100.
Bahasa lip-sync?
Tujuh: Inggeris, Mandarin, Kantonis, Jepun, Korea, Jerman, Perancis — WER sangat rendah.
Bandingan dengan OVI dan LTX?
Happy Horse 1.0 mengatasi OVI 1.1 (80.0% menang) dan LTX 2.3 (60.9%) dalam kualiti, penjajaran dan WER.