Skip to main content
HappyHorse 1.0

HappyHorse — Generasi video AI open source, dibayangkan ulang

HappyHorse 1.0 adalah model resmi open source pembuatan video dari tim Happy Horse — Transformer terpadu 15 miliar parameter yang bersama-sama menghasilkan video dan audio tersinkron dari teks atau gambar, dengan kualitas sinematik 1080p dan sinkron bibir tujuh bahasa.

15B
Parameter
40
Lapisan Transformer
38 dtk
5 dtk @ 1080p di H100
7
Bahasa lip-sync

Lihat Happy Horse beraksi

Cuplikan contoh dari Happy Horse 1.0 — ketuk untuk memutar.

Adegan sci-fi

"Robot menari di bulan dengan bumi di latar belakang"

Alam

"Seorang lansia di puncak gunung memandang lembah"

Kota

"Jalan cyberpunk malam hari dengan lampu neon"

Semua sampel adalah cuplikan 1080p 5–8 dtk yang dibuat dengan Happy Horse 1.0

Kemampuan inti HappyHorse

Arsitektur multimodal terpadu untuk generasi video dan audio bersamaan.

Transformer terpadu

Jaringan self-attention 40 lapis dengan 4 lapis spesifik modalitas di setiap ujung dan 32 lapis bersama.

Video + audio bersama

Menghasilkan dialog tersinkron, suara sekitar, dan Foley bersama frame video.

Distilasi DMD-2 8 langkah

Mengurangi denoising menjadi 8 langkah tanpa classifier-free guidance.

Sinkron bibir multibahasa

Mendukung Inggris, Mandarin, Kanton, Jepang, Korea, Jerman, dan Prancis.

Output 1080p

Cuplikan 5–8 dtk pada 1080p, rasio 16:9 dan 9:16.

Terbuka & self-hosted

Model dasar, distilasi, super-resolusi, dan kode inferensi dengan izin komersial.

Benchmark dan kinerja HappyHorse

Berdasarkan 2000 perbandingan penilaian manusia, Happy Horse 1.0 unggul dalam kualitas visual, keselarasan prompt, dan realisme fisik dengan WER terendah di antara pesaing terbuka. Peringkat #1 global di Artificial Analysis Video Arena, Elo 1333.

Model Visual Keselarasan Fisik WER (%)
OVI 1.1 4.73 4.10 4.41 40.45
LTX 2.3 4.76 4.12 4.56 19.23
Happy Horse 1.0 #1 4.80 4.18 4.52 14.60

Tingkat menang: 80.0% vs OVI 1.1 · 60.9% vs LTX 2.3

Dibandingkan model lain

Posisi Happy Horse 1.0 di antara model video AI terkemuka 2026.

Model Pengembang Parameter Masukan Lisensi
Happy Horse 1.0 Happy Horse Team ~15B Text / Image Terbuka + komersial
Seedance 2.0 ByteDance Seed Undisclosed Text / Image / Audio / Video Proprietary
Ovi 1.1 Character AI & Yale ~11B Text (Image opt.) Open source
LTX 2.3 Lightricks 22B Text / Image / Video / Audio Open source
Terbuka + komersial
Open source
Proprietary

Men-deploy HappyHorse 1.0

Happy Horse 1.0 berjalan di GPU bertenaga seperti NVIDIA H100 atau A100 (disarankan ≥48 GB VRAM). Kuantisasi FP8 dan checkpoint distilasi 8 langkah mengurangi memori pada satu GPU.

Bash
# Clone & install
git clone https://github.com/happy-horse/happyhorse-1.git
cd happyhorse-1
pip install -r requirements.txt

# Download weights
bash download_weights.sh

# Generate
python demo_generate.py --prompt "a robot dancing on the moon" --duration 5
Python
from happyhorse import HappyHorseModel

model = HappyHorseModel.from_pretrained("happy-horse/happyhorse-1.0")

video, audio = model.generate(
    prompt="an elder on a mountain peak overlooking the valley",
    duration_seconds=5,
    fps=24,
    language="en",
)

video.save("output.mp4")
audio.save("output.wav")

Memori GPU

≥48 GB VRAM (H100/A100)

Kecepatan generasi

~38 dtk untuk cuplikan 5 dtk di H100

Optimasi

Kuantisasi FP8 + 8 langkah

Dibangun peneliti, dipercaya kreator

HappyHorse diterbitkan dan dipelihara oleh tim riset HappyHorse dengan laporan teknis transparan tentang arsitektur, pelatihan, distilasi, protokol benchmark, dan batasan yang diketahui. Kode inferensi yang dapat direproduksi dan komitmen pada rilis video generatif yang bertanggung jawab.

Keahlian

Ditulis oleh praktisi Transformer multimodal, distilasi difusi, dan prapelatihan video skala besar.

Transparansi

Bobot terbuka, kode inferensi terbuka, metodologi benchmark dipublikasikan — dapat diverifikasi peneliti independen.

Tanggung jawab

Kami mendukung asal konten, watermarking, dan moderasi hilir. Kepatuhan regulasi AI diharapkan.

Pertanyaan umum

Jawaban tentang Happy Horse 1.0.

Apa itu Happy Horse 1.0?
Model open source 15B yang bersama-sama menghasilkan video dan audio tersinkron dari teks atau gambar.
Apakah gratis untuk komersial?
Ya. Termasuk model dasar, distilasi, super-resolusi, dan kode inferensi dengan hak komersial.
Perangkat keras apa yang dibutuhkan?
Disarankan NVIDIA H100 atau A100 dengan minimal 48 GB VRAM. ~38 dtk untuk cuplikan 5 dtk 1080p di H100.
Bahasa lip-sync apa saja?
Tujuh: Inggris, Mandarin, Kanton, Jepang, Korea, Jerman, Prancis — WER sangat rendah.
Dibanding OVI dan LTX?
Happy Horse 1.0 mengungguli OVI 1.1 (80,0% menang) dan LTX 2.3 (60,9%) dalam kualitas, keselarasan, dan WER.

Ada pertanyaan lain? Buka issue di GitHub