Skip to main content
HappyHorse 1.0

HappyHorse — การสร้างวิดีโอ AI แบบโอเพนซอร์ส นิยามใหม่

HappyHorse 1.0 คือโมเดลสร้างวิดีโอ AI แบบโอเพนซอร์สอย่างเป็นทางการจากทีม Happy Horse — Transformer แบบรวม 15 พารามิเตอร์พันล้านที่สร้างวิดีโอและเสียงซิงค์พร้อมกันจากข้อความหรือภาพ คุณภาพระดับภาพยนตร์ 1080p และซิงค์ริมฝีปาก 7 ภาษา

15B
พารามิเตอร์
40
ชั้น Transformer
38 วิ
5 วิ @ 1080p บน H100
7
ภาษาซิงค์ริมฝีปาก

ดู Happy Horse ทำงาน

คลิปตัวอย่างจาก Happy Horse 1.0 — แตะเพื่อเล่น

ฉากไซไฟ

"หุ่นยนต์เต้นรำบนดวงจันทร์โลกอยู่เบื้องหลัง"

ธรรมชาติ

"ชายสูงวัยบนยอดเขามองลงหุบเขา"

เมือง

"ถนนไซเบอร์พังก์กลางคืนมีไฟนีออน"

ตัวอย่างทั้งหมดเป็นคลิป 1080p ความยาว 5–8 วินาทีที่สร้างด้วย Happy Horse 1.0

ความสามารถหลักของ HappyHorse

สถาปัตยกรรมมัลติโมดัลแบบรวมสำหรับสร้างวิดีโอและเสียงพร้อมกัน

Transformer แบบรวม

เครือข่าย self-attention 40 ชั้น ชั้นเฉพาะโหมดะละ 4 ชั้นที่ปลายแต่ละด้าน และ 32 ชั้นร่วม

วิดีโอ + เสียงร่วมกัน

สร้างบทสนทนาซิงค์ เสียงแวดล้อม และ Foley พร้อมเฟรมวิดีโอ

การกลั่น DMD-2 แปดขั้น

ลดการลดสัญญาณรบกวนเหลือ 8 ขั้นโดยไม่ใช้ classifier-free guidance

ซิงค์ริมฝีปากหลายภาษา

อังกฤษ จีนกลาง กวางตุ้ง ญี่ปุ่น เกาหลี เยอรมัน ฝรั่งเศส

เอาต์พุต 1080p

คลิป 5–8 วินาที 1080p อัตราส่วน 16:9 และ 9:16

โอเพนและโฮสต์เอง

โมเดลฐาน โมเดลกลั่น โมดูลซูเปอร์เรซ และโค้ดอินฟเฟอเรนซ์พร้อมสิทธิ์เชิงพาณิชย์

เบนช์มาร์กและประสิทธิภาพ HappyHorse

จากการเปรียบเทียบ 2000 ครั้งที่มนุษย์ให้คะแนน Happy Horse 1.0 นำด้านคุณภาพภาพ การสอดคล้องพรอมต์ และความสมจริงทางกายภาพ พร้อม WER ต่ำสุดในคู่แข่งโอเพน อันดับ 1 โลกบน Artificial Analysis Video Arena Elo 1333

โมเดล ภาพ การจัดแนว กายภาพ WER (%)
OVI 1.1 4.73 4.10 4.41 40.45
LTX 2.3 4.76 4.12 4.56 19.23
Happy Horse 1.0 #1 4.80 4.18 4.52 14.60

อัตราชนะ: 80.0% กับ OVI 1.1 · 60.9% กับ LTX 2.3

เทียบกับโมเดลอื่น

ตำแหน่งของ Happy Horse 1.0 เทียบโมเดลวิดีโอ AI ชั้นนำปี 2026

โมเดล ผู้พัฒนา พารามิเตอร์ อินพุต ใบอนุญาต
Happy Horse 1.0 Happy Horse Team ~15B Text / Image โอเพน + เชิงพาณิชย์
Seedance 2.0 ByteDance Seed Undisclosed Text / Image / Audio / Video กรรมสิทธิ์
Ovi 1.1 Character AI & Yale ~11B Text (Image opt.) โอเพนซอร์ส
LTX 2.3 Lightricks 22B Text / Image / Video / Audio โอเพนซอร์ส
โอเพน + เชิงพาณิชย์
โอเพนซอร์ส
กรรมสิทธิ์

ใช้งาน HappyHorse 1.0

Happy Horse 1.0 ทำงานบน GPU สูงสเปกเช่น NVIDIA H100 หรือ A100 (แนะนำ VRAM ≥48 GB) การควอนตัม FP8 และเช็กพอยต์กลั่น 8 ขั้นลดหน่วยความจำเมื่อใช้ GPU เดียว

Bash
# Clone & install
git clone https://github.com/happy-horse/happyhorse-1.git
cd happyhorse-1
pip install -r requirements.txt

# Download weights
bash download_weights.sh

# Generate
python demo_generate.py --prompt "a robot dancing on the moon" --duration 5
Python
from happyhorse import HappyHorseModel

model = HappyHorseModel.from_pretrained("happy-horse/happyhorse-1.0")

video, audio = model.generate(
    prompt="an elder on a mountain peak overlooking the valley",
    duration_seconds=5,
    fps=24,
    language="en",
)

video.save("output.mp4")
audio.save("output.wav")

หน่วยความจำ GPU

≥48 GB VRAM (H100/A100)

ความเร็วการสร้าง

ประมาณ 38 วิ สำหรับคลิป 5 วิ บน H100

การปรับแต่ง

ควอนตัม FP8 + 8 ขั้น

สร้างโดยนักวิจัย ไว้วางใจโดยครีเอเตอร์

HappyHorse เผยแพร่และดูแลโดยทีมวิจัย HappyHorse พร้อมรายงานเทคนิคโปร่งใสเรื่องสถาปัตยกรรม การฝึก การกลั่น โปรโตคอลเบนช์มาร์ก และข้อจำกัดที่ทราบ โค้ดอินฟเฟอเรนซ์ทำซ้ำได้และมุ่งสู่การเผยแพร่วิดีโอเชิงสร้างอย่างรับผิดชอบ

ความเชี่ยวชาญ

เขียนโดยผู้ปฏิบัติงาน Transformer หลายโหมด การกลั่นแบบ diffusion และพรีเทรนนิงวิดีโอขนาดใหญ่

ความโปร่งใส

น้ำหนักเปิด โค้ดอินฟเฟอเรนซ์เปิด เมธอดโลจิสติกส์เบนช์มาร์กเผยแพร่ — ตรวจสอบได้โดยนักวิจัยอิสระ

ความรับผิดชอบ

สนับสนุนที่มาของเนื้อหา ลายน้ำ และการกลั่นกรองดาวน์สตรีม คาดหวังให้ปฏิบัติตามกฎ AI

คำถามที่พบบ่อย

คำตอบเกี่ยวกับ Happy Horse 1.0

Happy Horse 1.0 คืออะไร?
โมเดลโอเพนซอร์ส 15B พารามิเตอร์ที่สร้างวิดีโอและเสียงซิงค์พร้อมกันจากข้อความหรือภาพ
ใช้เชิงพาณิชย์ฟรีไหม?
ใช่ รวมโมเดลฐาน กลั่น ซูเปอร์เรซ และโค้ดอินฟเฟอเรนซ์พร้อมสิทธิ์เชิงพาณิชย์
ต้องการฮาร์ดแวร์อะไร?
แนะนำ NVIDIA H100 หรือ A100 VRAM อย่างน้อย 48 GB คลิป 5 วิ 1080p บน H100 ประมาณ 38 วิ
ซิงค์ริมฝีปากกี่ภาษา?
เจ็ดภาษา: อังกฤษ จีนกลาง กวางตุ้ง ญี่ปุ่น เกาหลี เยอรมัน ฝรั่งเศส — WER ต่ำมาก
เทียบ OVI และ LTX?
Happy Horse 1.0 เหนือกว่า OVI 1.1 (ชนะ 80.0%) และ LTX 2.3 (60.9%) ในคุณภาพ การสอดคล้องพรอมต์ และ WER

มีคำถามเพิ่ม? เปิด issue บน GitHub