HappyHorse 1.0 2026年發布

HappyHorse — 重新構想的開源AI影片生成

HappyHorse 1.0 是Happy Horse團隊推出的官方開源AI影片生成模型——150億參數統一Transformer架構，可從文字或圖像提示聯合生成影片與同步音訊，支援電影級1080p畫質和七種語言唇形同步。

立即使用 HappyHorse 探索功能

15B

參數

Transformer層

38秒

H100上5秒1080p

唇形同步語言

觀看 Happy Horse 演示

由 Happy Horse 1.0 生成的範例片段——點擊播放觀看。

科幻場景

"一個機器人在月球上跳舞，背景是地球"

自然場景

"一位老人在山頂俯瞰山谷"

城市場景

"霓虹燈照亮的賽博龐克城市街道"

所有樣本均為使用 Happy Horse 1.0 生成的5-8秒1080p片段

HappyHorse 核心能力

專為聯合影片與音訊生成而構建的統一多模態架構。

統一Transformer

40層自注意力網路，兩端各4層模態特定層和32層共享層——單流處理，帶逐頭門控實現穩定訓練。

音視訊聯合生成

同步生成對話、環境音和擬音效果——無需後期配音。

8步DMD-2蒸餾

無需無分類器指導即可將去噪降至僅8步，並透過內部MagiCompiler執行時進一步加速。

多語言唇形同步

原生支援英語、國語、粵語、日語、韓語、德語和法語——業界領先的低詞錯誤率。

1080p高畫質輸出

5-8秒片段，1080p解析度，標準長寬比（16:9、9:16）——適用於社群、廣告和電影場景。

開源可自託管

基礎模型、蒸餾模型、超解析度模組和推理程式碼全部開源發布，含商業使用許可。

HappyHorse 基準測試與效能

基於2000次人工評分對比，Happy Horse 1.0 在視覺品質、提示對齊度和物理真實性方面領先，同時提供開源競品中最低的詞錯誤率。Happy Horse 在Artificial Analysis影片競技場全球排名第1，Elo評分1333。

模型	視覺	對齊度	物理真實	WER (%)
OVI 1.1	4.73	4.10	4.41	40.45
LTX 2.3	4.76	4.12	4.56	19.23
Happy Horse 1.0 第1名	4.80	4.18	4.52	14.60

勝率：80.0% 對 OVI 1.1 · 60.9% 對 LTX 2.3

與其他模型對比

Happy Horse 1.0 與2026年領先AI影片生成模型的對比。

模型	開發者	參數量	輸入	授權
Happy Horse 1.0	Happy Horse Team	~15B	Text / Image	開源+商業
Seedance 2.0	ByteDance Seed	Undisclosed	Text / Image / Audio / Video	專有
Ovi 1.1	Character AI & Yale	~11B	Text (Image opt.)	開源
LTX 2.3	Lightricks	22B	Text / Image / Video / Audio	開源

開源+商業

開源

專有

部署 HappyHorse 1.0

Happy Horse 1.0 可在NVIDIA H100或A100等高效能GPU上運行（建議≥48GB顯示記憶體）。FP8量化和8步蒸餾檢查點可減少單GPU部署的記憶體占用。

Bash

# Clone & install
git clone https://github.com/happy-horse/happyhorse-1.git
cd happyhorse-1
pip install -r requirements.txt

# Download weights
bash download_weights.sh

# Generate
python demo_generate.py --prompt "a robot dancing on the moon" --duration 5

Python

from happyhorse import HappyHorseModel

model = HappyHorseModel.from_pretrained("happy-horse/happyhorse-1.0")

video, audio = model.generate(
    prompt="an elder on a mountain peak overlooking the valley",
    duration_seconds=5,
    fps=24,
    language="en",
)

video.save("output.mp4")
audio.save("output.wav")

GPU顯示記憶體

≥48GB (H100/A100)

生成速度

H100上5秒片段約38秒

最佳化

FP8量化 + 8步

由研究者構建，受創作者信賴

HappyHorse 由HappyHorse研究團隊發布和維護，提供涵蓋架構、訓練方法、蒸餾、基準協定和已知限制的透明技術報告。我們發布可複現的推理程式碼，並致力於負責任地發布生成式影片技術。

專業性

由從事多模態Transformer、擴散蒸餾和大規模影片預訓練的研究者編寫。

透明度

開放權重、開放推理程式碼和已發布的基準方法——可由獨立研究者驗證。

責任感

我們支援內容溯源、浮水印和下游審核。使用者應遵守適用的AI法規。

檢視我們的開源儲存庫

部落格

來自 HappyHorse 團隊的最新更新、教學與短文。

檢視全部

常見問題

關於 Happy Horse 1.0 的常見問題解答。

什麼是 Happy Horse 1.0？

Happy Horse 1.0 是一個150億參數的開源AI影片生成模型，可從文字或圖像提示聯合生成影片和同步音訊。

Happy Horse 可以免費商用嗎？

可以。Happy Horse 以開源形式發布，含商業使用權利，包括基礎模型、蒸餾模型、超解析度模組和推理程式碼。

執行 Happy Horse 需要什麼硬體？

建議使用NVIDIA H100或A100 GPU，至少48GB顯示記憶體。在H100上生成5秒1080p片段約需38秒。

Happy Horse 支援哪些語言的唇形同步？

七種語言：英語、國語、粵語、日語、韓語、德語和法語——業界領先的低詞錯誤率。

Happy Horse 與 OVI 和 LTX 相比如何？

Happy Horse 1.0 在視覺品質、提示對齊度和詞錯誤率方面優於 OVI 1.1（勝率80.0%）和 LTX 2.3（勝率60.9%）。

還有其他問題？在 GitHub 上提交 Issue