الانتقال إلى المحتوى الرئيسي
HappyHorse 1.0

HappyHorse — إعادة تصور توليد الفيديو بالذكاء الاصطناعي مفتوح المصدر

HappyHorse 1.0 هو نموذج توليد فيديو بالذكاء الاصطناعي مفتوح المصدر من فريق Happy Horse — محول موحد بـ 15 مليار معامل يُنتج فيديو وصوتًا متزامنين من نص أو صور، بجودة سينمائية 1080p ومزامنة شفاه بسبع لغات.

15B
معامل
40
طبقات Transformer
38ث
5ث @ 1080p على H100
7
لغات مزامنة الشفاه

شاهد Happy Horse في العمل

عينات مقطعية من إنتاج Happy Horse 1.0 — اضغط تشغيل للمشاهدة.

مشهد خيال علمي

"روبوت يرقص على القمر مع الأرض في الخلفية"

مشهد طبيعي

"مسنٌّ على قمة جبل يطل على الوادي"

مشهد حضري

"شارع مدينة سايبربانك ليلاً بإضاءة نيون"

جميع العينات مقاطع 1080p لمدة 5-8 ثوانٍ مُنشأة بـ Happy Horse 1.0

القدرات الأساسية لـ HappyHorse

بنية متعددة الوسائط موحدة مصممة خصيصًا لتوليد الفيديو والصوت معًا.

محول موحد

شبكة ذاتية الاهتمام بـ 40 طبقة مع 4 طبقات خاصة بالوسائط في كل طرف و32 طبقة مشتركة.

فيديو + صوت متزامن

يُنتج حوارًا متزامنًا وصوتًا محيطًا ومؤثرات Foley إلى جانب إطارات الفيديو.

تقطير DMD-2 بـ 8 خطوات

يقلل التمويه إلى 8 خطوات فقط بدون توجيه خالي من المصنف.

مزامنة شفاه متعددة اللغات

دعم أصلي للإنجليزية والماندرين والكانتونية واليابانية والكورية والألمانية والفرنسية.

إخراج 1080p

مقاطع 5-8 ثوانٍ بدقة 1080p وبنِسَج قياسية (16:9، 9:16).

مفتوح وقابل للاستضافة الذاتية

النموذج الأساسي والمقطّر ووحدة الدقة الفائقة وكود الاستدلال مُصدَر بشكل مفتوح مع إذن استخدام تجاري.

المعايير وأداء HappyHorse

استنادًا إلى 2000 مقارنة بشرية، Happy Horse 1.0 يتقدم في الجودة البصرية والتوافق مع التلميح والواقعية الفيزيائية مع أقل معدل خطأ كلمات بين المنافسين المفتوحين. حصل Happy Horse على المركز الأول عالميًا في Artificial Analysis Video Arena بدرجة Elo 1333.

النموذج بصري التوافق فيزيائي WER (%)
OVI 1.1 4.73 4.10 4.41 40.45
LTX 2.3 4.76 4.12 4.56 19.23
Happy Horse 1.0 #1 4.80 4.18 4.52 14.60

معدل الفوز: 80.0% مقابل OVI 1.1 · 60.9% مقابل LTX 2.3

مقارنة مع نماذج أخرى

مكانة Happy Horse 1.0 أمام أبرز نماذج توليد الفيديو بالذكاء الاصطناعي في 2026.

النموذج المطوّر المعاملات المدخلات الترخيص
Happy Horse 1.0 Happy Horse Team ~15B Text / Image مفتوح + تجاري
Seedance 2.0 ByteDance Seed Undisclosed Text / Image / Audio / Video ملكي
Ovi 1.1 Character AI & Yale ~11B Text (Image opt.) مفتوح المصدر
LTX 2.3 Lightricks 22B Text / Image / Video / Audio مفتوح المصدر
مفتوح + تجاري
مفتوح المصدر
ملكي

نشر HappyHorse 1.0

يعمل Happy Horse 1.0 على وحدات معالجة رسومات عالية الأداء مثل NVIDIA H100 أو A100 (يُنصح بـ ≥48 جيجابايت VRAM). تقلل كمية FP8 ونقطة التحقق المقطّرة ذات 8 خطوات من ذاكرة النشر على GPU واحد.

Bash
# Clone & install
git clone https://github.com/happy-horse/happyhorse-1.git
cd happyhorse-1
pip install -r requirements.txt

# Download weights
bash download_weights.sh

# Generate
python demo_generate.py --prompt "a robot dancing on the moon" --duration 5
Python
from happyhorse import HappyHorseModel

model = HappyHorseModel.from_pretrained("happy-horse/happyhorse-1.0")

video, audio = model.generate(
    prompt="an elder on a mountain peak overlooking the valley",
    duration_seconds=5,
    fps=24,
    language="en",
)

video.save("output.mp4")
audio.save("output.wav")

ذاكرة GPU

≥48 جيجابايت VRAM (H100/A100)

سرعة التوليد

حوالي 38 ثانية لمقطع 5 ثوانٍ على H100

التحسين

كمية FP8 + 8 خطوات

من الباحثين، بثقة المُنشئين

يصدر HappyHorse فريق البحث HappyHorse ويصونه، مع تقرير تقني شفاف يغطي البنية والتدريب والتقطير وبروتوكولات المعايير والقيود المعروفة. ننشر كود استدلال قابل لإعادة الإنتاج ونلتزم بالإصدار المسؤول لتقنية الفيديو التوليدي.

الخبرة

من ممارسي Transformers متعددة الوسائط وتقطير الانتشار والتدريب المسبق للفيديو واسع النطاق.

الشفافية

أوزان مفتوحة وكود استدلال مفتوح ومنهجية معايير منشورة — قابلة للتحقق من الباحثين المستقلين.

المسؤولية

ندعم أصل المحتوى والعلامات المائية والإشراف اللاحق. يُتوقع من المستخدمين الامتثال للوائح الذكاء الاصطناعي.

الأسئلة الشائعة

إجابات على الأسئلة الشائعة حول Happy Horse 1.0.

ما هو Happy Horse 1.0؟
Happy Horse 1.0 هو نموذج توليد فيديو بالذكاء الاصطناعي مفتوح المصدر بـ 15 مليار معامل يُنتج فيديو وصوتًا متزامنين من نص أو صور.
هل Happy Horse مجاني للاستخدام التجاري؟
نعم. يُطلق Happy Horse كمفتوح المصدر مع حقوق استخدام تجارية، بما في ذلك النموذج الأساسي والمقطّر ووحدة الدقة الفائقة وكود الاستدلال.
ما الأجهزة اللازمة لتشغيل Happy Horse؟
يُنصح بـ GPU من NVIDIA H100 أو A100 بسعة VRAM لا تقل عن 48 جيجابايت. يُولَّد مقطع 5 ثوانٍ بدقة 1080p في حوالي 38 ثانية على H100.
ما اللغات التي يدعمها Happy Horse لمزامنة الشفاه؟
سبع لغات: الإنجليزية والماندرين والكانتونية واليابانية والكورية والألمانية والفرنسية — مع أقل معدل خطأ كلمات في فئته.
كيف يقارن Happy Horse بـ OVI وLTX؟
يتفوق Happy Horse 1.0 على OVI 1.1 (80.0% معدل فوز) وLTX 2.3 (60.9%) في الجودة البصرية والتوافق مع التلميح ومعدل خطأ الكلمات.

المزيد من الأسئلة؟ أرسل issue على GitHub