Skip to main content
HappyHorse 1.0

HappyHorse — 重新构想的开源AI视频生成

HappyHorse 1.0 是Happy Horse团队推出的官方开源AI视频生成模型——150亿参数统一Transformer架构,可从文本或图像提示联合生成视频与同步音频,支持电影级1080p画质和七种语言唇形同步。

15B
参数
40
Transformer层
38秒
H100上5秒1080p
7
唇形同步语言

观看 Happy Horse 演示

由 Happy Horse 1.0 生成的示例片段——点击播放观看。

科幻场景

"一个机器人在月球上跳舞,背景是地球"

自然场景

"一位老人在山顶俯瞰山谷"

城市场景

"霓虹灯照亮的赛博朋克城市街道"

所有样本均为使用 Happy Horse 1.0 生成的5-8秒1080p片段

HappyHorse 核心能力

专为联合视频与音频生成而构建的统一多模态架构。

统一Transformer

40层自注意力网络,两端各4层模态特定层和32层共享层——单流处理,带逐头门控实现稳定训练。

音视频联合生成

同步生成对话、环境音和拟音效果——无需后期配音。

8步DMD-2蒸馏

无需无分类器指导即可将去噪降至仅8步,并通过内部MagiCompiler运行时进一步加速。

多语言唇形同步

原生支持英语、普通话、粤语、日语、韩语、德语和法语——行业领先的低词错误率。

1080p高清输出

5-8秒片段,1080p分辨率,标准宽高比(16:9、9:16)——适用于社交、广告和电影场景。

开源可自托管

基础模型、蒸馏模型、超分辨率模块和推理代码全部开源发布,含商业使用许可。

HappyHorse 基准测试与性能

基于2000次人工评分对比,Happy Horse 1.0 在视觉质量、提示对齐度和物理真实性方面领先,同时提供开源竞品中最低的词错误率。Happy Horse 在Artificial Analysis视频竞技场全球排名第1,Elo评分1333。

模型 视觉 对齐度 物理真实 WER (%)
OVI 1.1 4.73 4.10 4.41 40.45
LTX 2.3 4.76 4.12 4.56 19.23
Happy Horse 1.0 第1名 4.80 4.18 4.52 14.60

胜率:80.0% 对 OVI 1.1 · 60.9% 对 LTX 2.3

与其他模型对比

Happy Horse 1.0 与2026年领先AI视频生成模型的对比。

模型 开发者 参数量 输入 许可
Happy Horse 1.0 Happy Horse Team ~15B Text / Image 开源+商业
Seedance 2.0 ByteDance Seed Undisclosed Text / Image / Audio / Video 专有
Ovi 1.1 Character AI & Yale ~11B Text (Image opt.) 开源
LTX 2.3 Lightricks 22B Text / Image / Video / Audio 开源
开源+商业
开源
专有

部署 HappyHorse 1.0

Happy Horse 1.0 可在NVIDIA H100或A100等高性能GPU上运行(建议≥48GB显存)。FP8量化和8步蒸馏检查点可减少单GPU部署的内存占用。

Bash
# Clone & install
git clone https://github.com/happy-horse/happyhorse-1.git
cd happyhorse-1
pip install -r requirements.txt

# Download weights
bash download_weights.sh

# Generate
python demo_generate.py --prompt "a robot dancing on the moon" --duration 5
Python
from happyhorse import HappyHorseModel

model = HappyHorseModel.from_pretrained("happy-horse/happyhorse-1.0")

video, audio = model.generate(
    prompt="an elder on a mountain peak overlooking the valley",
    duration_seconds=5,
    fps=24,
    language="en",
)

video.save("output.mp4")
audio.save("output.wav")

GPU显存

≥48GB (H100/A100)

生成速度

H100上5秒片段约38秒

优化

FP8量化 + 8步

由研究者构建,受创作者信赖

HappyHorse 由HappyHorse研究团队发布和维护,提供涵盖架构、训练方法、蒸馏、基准协议和已知限制的透明技术报告。我们发布可复现的推理代码,并致力于负责任地发布生成式视频技术。

专业性

由从事多模态Transformer、扩散蒸馏和大规模视频预训练的研究者编写。

透明度

开放权重、开放推理代码和已发布的基准方法——可由独立研究者验证。

责任感

我们支持内容溯源、水印和下游审核。用户应遵守适用的AI法规。

常见问题

关于 Happy Horse 1.0 的常见问题解答。

什么是 Happy Horse 1.0?
Happy Horse 1.0 是一个150亿参数的开源AI视频生成模型,可从文本或图像提示联合生成视频和同步音频。
Happy Horse 可以免费商用吗?
可以。Happy Horse 以开源形式发布,含商业使用权利,包括基础模型、蒸馏模型、超分辨率模块和推理代码。
运行 Happy Horse 需要什么硬件?
建议使用NVIDIA H100或A100 GPU,至少48GB显存。在H100上生成5秒1080p片段约需38秒。
Happy Horse 支持哪些语言的唇形同步?
七种语言:英语、普通话、粤语、日语、韩语、德语和法语——行业领先的低词错误率。
Happy Horse 与 OVI 和 LTX 相比如何?
Happy Horse 1.0 在视觉质量、提示对齐度和词错误率方面优于 OVI 1.1(胜率80.0%)和 LTX 2.3(胜率60.9%)。

还有其他问题? 在 GitHub 上提交 Issue