HappyHorse 1.0 Dikeluarkan 2026

HappyHorse — Penjanaan video AI sumber terbuka, dibayangkan semula

HappyHorse 1.0 ialah model rasmi sumber terbuka penjanaan video pasukan Happy Horse — Transformer bersatu 15 bilion parameter yang bersama-sama menghasilkan video dan audio disegerak daripada teks atau imej, dengan kualiti sinematik 1080p dan segerak bibir tujuh bahasa.

Gunakan HappyHorse sekarang Terokai ciri

15B

Parameter

Lapisan Transformer

38s

5s @ 1080p pada H100

Bahasa lip-sync

Lihat Happy Horse beraksi

Klip contoh dijana Happy Horse 1.0 — ketik untuk main.

Adegan sci-fi

"Robot menari di bulan dengan bumi di latar belakang"

Alam

"Warga emas di puncak gunung memandang lembah"

Bandar

"Jalan cyberpunk pada waktu malam dengan lampu neon"

Semua sampel ialah klip 1080p 5–8s dijana dengan Happy Horse 1.0

Keupayaan teras HappyHorse

Seni bina multimodal bersatu untuk penjanaan video dan audio bersama.

Transformer bersatu

Rangkaian self-attention 40 lapisan dengan 4 lapisan khusus modaliti di setiap hujung dan 32 lapisan dikongsi.

Video + audio bersama

Menjana dialog disegerak, bunyi persekitaran dan Foley bersama bingkai video.

Penyulingan DMD-2 8 langkah

Mengurangkan denoising kepada 8 langkah tanpa classifier-free guidance.

Segerak bibir pelbagai bahasa

Inggeris, Mandarin, Kantonis, Jepun, Korea, Jerman dan Perancis.

Output 1080p

Klip 5–8 saat pada 1080p, nisbah 16:9 dan 9:16.

Terbuka & self-hosted

Model asas, disuling, super-resolusi dan kod inferens dengan kebenaran komersial.

Penanda aras dan prestasi HappyHorse

Berdasarkan 2000 perbandingan dinilai manusia, Happy Horse 1.0 mendahului dalam kualiti visual, penjajaran prompt dan realisme fizikal dengan WER terendah dalam kalangan pesaing terbuka. Kedudukan #1 global di Artificial Analysis Video Arena, Elo 1333.

Model AI	Kualiti visual	Penjajaran	Fizikal	WER (%)
OVI 1.1	4.73	4.10	4.41	40.45
LTX 2.3	4.76	4.12	4.56	19.23
Happy Horse 1.0 #1	4.80	4.18	4.52	14.60

Kadar menang: 80.0% vs OVI 1.1 · 60.9% vs LTX 2.3

Bandingan dengan model lain

Kedudukan Happy Horse 1.0 berbanding model video AI terkemuka 2026.

Model AI	Pembangun	Parameter	Input	Lesen
Happy Horse 1.0	Happy Horse Team	~15B	Text / Image	Terbuka + komersial
Seedance 2.0	ByteDance Seed	Undisclosed	Text / Image / Audio / Video	Proprietari
Ovi 1.1	Character AI & Yale	~11B	Text (Image opt.)	Sumber terbuka
LTX 2.3	Lightricks	22B	Text / Image / Video / Audio	Sumber terbuka

Terbuka + komersial

Sumber terbuka

Proprietari

Melaksanakan HappyHorse 1.0

Happy Horse 1.0 berjalan pada GPU berkuasa tinggi seperti NVIDIA H100 atau A100 (disyorkan ≥48 GB VRAM). Kuantisasi FP8 dan checkpoint disuling 8 langkah mengurangkan memori pada satu GPU.

Bash

# Clone & install
git clone https://github.com/happy-horse/happyhorse-1.git
cd happyhorse-1
pip install -r requirements.txt

# Download weights
bash download_weights.sh

# Generate
python demo_generate.py --prompt "a robot dancing on the moon" --duration 5

Python

from happyhorse import HappyHorseModel

model = HappyHorseModel.from_pretrained("happy-horse/happyhorse-1.0")

video, audio = model.generate(
    prompt="an elder on a mountain peak overlooking the valley",
    duration_seconds=5,
    fps=24,
    language="en",
)

video.save("output.mp4")
audio.save("output.wav")

Memori GPU

≥48 GB VRAM (H100/A100)

Kelajuan penjanaan

~38s untuk klip 5s pada H100

Pengoptimuman

Kuantisasi FP8 + 8 langkah

Dibina penyelidik, dipercayai pencipta

HappyHorse diterbitkan dan diselenggara oleh pasukan penyelidikan HappyHorse dengan laporan teknikal telus tentang seni bina, latihan, penyulingan, protokol penanda aras dan had yang diketahui. Kod inferens boleh diulang dan komitmen kepada pelepasan video generatif yang bertanggungjawab.

Kepakaran

Ditulis oleh pengamal Transformer multimodal, penyulingan resapan dan prapra latihan video berskala besar.

Ketelusan

Pemberat terbuka, kod inferens terbuka, metodologi penanda aras diterbitkan — boleh disahkan penyelidik bebas.

Tanggungjawab

Kami menyokong asal kandungan, penanda air dan moderasi hilir. Pematuhan peraturan AI dijangkakan.

Lihat repositori sumber terbuka kami

Blog

Kemas kini terkini daripada pasukan HappyHorse.

Lihat Semua

Soalan lazim

Jawapan tentang Happy Horse 1.0.

Apakah Happy Horse 1.0?

Model sumber terbuka 15B yang bersama-sama menjana video dan audio disegerak daripada teks atau imej.

Percuma untuk komersial?

Ya. Termasuk model asas, disuling, super-resolusi dan kod inferens dengan hak komersial.

Perkakasan diperlukan?

Disyorkan NVIDIA H100 atau A100 dengan sekurang-kurangnya 48 GB VRAM. ~38s untuk klip 5s 1080p pada H100.

Bahasa lip-sync?

Tujuh: Inggeris, Mandarin, Kantonis, Jepun, Korea, Jerman, Perancis — WER sangat rendah.

Bandingan dengan OVI dan LTX?

Happy Horse 1.0 mengatasi OVI 1.1 (80.0% menang) dan LTX 2.3 (60.9%) dalam kualiti, penjajaran dan WER.

Soalan lain? Buka isu di GitHub