Skip to main content
HappyHorse 1.0

HappyHorse — Açık kaynak AI video üretimi, yeniden tasarlandı

HappyHorse 1.0, Happy Horse ekibinin resmi açık kaynak video modelidir — metin veya görüntü istemlerinden sinematik 1080p kalitesinde ve yedi dilde dudak senkronu ile birlikte video ve senkronize ses üreten 15 milyar parametreli birleşik bir Transformer.

15B
Parametre
40
Transformer katmanları
38 sn
H100’de 5 sn @ 1080p
7
Dudak senkronu dilleri

Happy Horse’u izleyin

Happy Horse 1.0 ile oluşturulmuş örnek klipler — oynatmak için dokunun.

Bilimkurgu sahnesi

"Arka planda Dünya varken Ay’da dans eden robot"

Doğa

"Zirvede vadiye bakan yaşlı bir adam"

Şehir

"Gece neon ışıklı siberpunk sokak"

Tüm örnekler Happy Horse 1.0 ile üretilmiş 5–8 sn 1080p kliplerdir

HappyHorse temel yetenekleri

Birlikte video ve ses üretimi için birleşik çok modlu mimari.

Birleşik Transformer

Her uçta 4 modaliteye özgü katman ve 32 paylaşımlı katmanlı 40 katmanlı self-attention ağı.

Birlikte video + ses

Video kareleriyle birlikte senkron diyalog, ortam sesi ve Foley üretir.

8 adımlı DMD-2 damıtma

Sınıflandırıcısız yönlendirme olmadan gürültü gidermeyi 8 adıma indirir.

Çok dilli dudak senkronu

İngilizce, Mandarin, Kantonca, Japonca, Korece, Almanca ve Fransızca yerel destek.

1080p çıktı

5–8 sn klipler, 16:9 ve 9:16 en-boy oranları.

Açık ve self-host

Temel model, damıtılmış model, süper çözünürlük ve ticari izinli çıkarım kodu.

HappyHorse kıyaslamaları ve performansı

2000 insan değerlendirmeli karşılaştırmaya göre Happy Horse 1.0 görsel kalite, istem uyumu ve fiziksel gerçekçilikte önde, açık rakipler arasında en düşük kelime hata oranına sahip. Artificial Analysis Video Arena’da dünya 1., Elo 1333.

Model Görsel Uyum Fizik WER (%)
OVI 1.1 4.73 4.10 4.41 40.45
LTX 2.3 4.76 4.12 4.56 19.23
Happy Horse 1.0 #1 4.80 4.18 4.52 14.60

Kazanma oranı: 80.0% vs OVI 1.1 · 60.9% vs LTX 2.3

Diğer modellerle karşılaştırma

2026 önde gelen AI video modellerine göre Happy Horse 1.0’ın konumu.

Model Geliştirici Parametre Girdiler Lisans
Happy Horse 1.0 Happy Horse Team ~15B Text / Image Açık + ticari
Seedance 2.0 ByteDance Seed Undisclosed Text / Image / Audio / Video Tescilli
Ovi 1.1 Character AI & Yale ~11B Text (Image opt.) Açık kaynak
LTX 2.3 Lightricks 22B Text / Image / Video / Audio Açık kaynak
Açık + ticari
Açık kaynak
Tescilli

HappyHorse 1.0 dağıtımı

Happy Horse 1.0 NVIDIA H100 veya A100 gibi yüksek performanslı GPU’larda çalışır (≥48 GB VRAM önerilir). FP8 nicemleme ve 8 adımlı damıtılmış kontrol noktası tek GPU bellek kullanımını azaltır.

Bash
# Clone & install
git clone https://github.com/happy-horse/happyhorse-1.git
cd happyhorse-1
pip install -r requirements.txt

# Download weights
bash download_weights.sh

# Generate
python demo_generate.py --prompt "a robot dancing on the moon" --duration 5
Python
from happyhorse import HappyHorseModel

model = HappyHorseModel.from_pretrained("happy-horse/happyhorse-1.0")

video, audio = model.generate(
    prompt="an elder on a mountain peak overlooking the valley",
    duration_seconds=5,
    fps=24,
    language="en",
)

video.save("output.mp4")
audio.save("output.wav")

GPU belleği

≥48 GB VRAM (H100/A100)

Üretim hızı

H100’de 5 sn klip için ~38 sn

Optimizasyon

FP8 nicemleme + 8 adım

Araştırmacılar inşa etti, yaratıcılar güveniyor

HappyHorse, HappyHorse araştırma ekibi tarafından yayınlanır ve sürdürülür; mimari, eğitim, damıtma, kıyaslama protokolleri ve bilinen sınırlamalar şeffaf teknik raporda. Yeniden üretilebilir çıkarım kodu ve sorumlu üretken video yayını taahhüdü.

Uzmanlık

Çok modlu Transformer’lar, difüzyon damıtması ve büyük ölçekli video ön eğitimi üzerinde çalışan uygulayıcılar tarafından yazıldı.

Şeffaflık

Açık ağırlıklar, açık çıkarım kodu, yayımlanmış kıyaslama metodolojisi — bağımsız araştırmacılarca doğrulanabilir.

Sorumluluk

İçerik kaynağı, filigran ve aşağı akış moderasyonunu destekleriz. AI düzenlemelerine uyum beklenir.

Sık sorulan sorular

Happy Horse 1.0 hakkında yanıtlar.

Happy Horse 1.0 nedir?
Metin veya görüntü istemlerinden birlikte video ve senkronize ses üreten 15B parametreli açık kaynak model.
Ticari kullanım ücretsiz mi?
Evet. Temel model, damıtılmış model, süper çözünürlük ve ticari haklarla çıkarım kodu dahil.
Hangi donanım gerekir?
En az 48 GB VRAM’li NVIDIA H100 veya A100 önerilir. H100’de 5 sn 1080p klip ~38 sn.
Hangi dillerde dudak senkronu?
Yedi dil: İngilizce, Mandarin, Kantonca, Japonca, Korece, Almanca, Fransızca — düşük WER.
OVI ve LTX ile karşılaştırma?
Happy Horse 1.0 görsel kalite, istem uyumu ve WER’de OVI 1.1 (%80,0 galibiyet) ve LTX 2.3 (%60,9) üzerindedir.

Başka sorularınız mı var? GitHub’da issue açın