يرجى تفعيل الجافا سكربت للحصول على أفضل جودة.

جاري تحميل الصفحة

دليل منصة مكنة - أفضل الممارسات للإدخال (Best Practices for Input)

ديسمبر 10, 2025 خالد محمود 5 دقيقة قراءة
دليل منصة مكنة - أفضل الممارسات للإدخال (Best Practices for Input)

أفضل الممارسات للإدخال (Best Practices for Input)

الأرقام (Numbers)

  1. الأرقام: قد تواجه نماذج تحويل النص إلى كلام صعوبة مع التنسيقات مثل أرقام الهواتف أو العملات.
  2. توصية: اكتب الأرقام ككلمات لإزالة الغموض (على سبيل المثال، اكتب واحد بدلاً من 1).
  3. أرقام الهواتف: 123-456-7890 ← واحد اثنان ثلاثة، أربعة خمسة ستة...
  4. العملات: $45.67 ← خمسة وأربعون دولاراً وسبعة وستون سنتاً.
  5. الاختصارات: قم بتوسيعها وكتابتها كاملة من أجل الوضوح.
  6. د. ← دكتور، ش. ← شارع.
  7. الروابط/الرموز:
  8. moknah.io/docs ← مُكنة دوت آي أو سلاش دوكس (اكتبها كما

تُنطق).

  1. 100% ← مائة بالمائة.

نظرة عامة (Overview)

للبدء في توليد أول ملف صوتي لك باستخدام تحويل النص إلى صوت أو استوديو تحويل النص إلى صوت (Text to Audio Studio)، فالأمر بسيط للغاية. ومع ذلك، للاستفادة القصوى من هذه الميزات، هناك بعض الأمور التي يجب وضعها في الاعتبار.

الدليل (Guide)

1

اكتب نصك أو الصقه في مربع الإدخال في صفحة تحويل النص إلى صوت.

يمكنك دائماً تضمين وسوم تعبيرية في نصك لتحقيق أداء فائق في توليد الصوت.

  1. في حال تفعيل العواطف (Emotions): استخدم وسوم داخل أقواس مثل [shouting] (صراخ) أو [breathing] (تنفس). هذه الوسوم فعالة للغاية) راجع قسم Voice Tags للحصول على القائمة الكاملة(.
  2. في حال عدم تفعيل العواطف: لا يزال بإمكانك وصف الأداء المطلوب (مثل كتابة excited أي متحمس) أو استخدام وسوم محاطة بـ </xxxx>، على الرغم من أن هذه الوسوم تجريبية وقد لا تعمل بنفس الثبات.
  3. ملاحظة: يجب أن تكون جميع الوسوم باللغة الإنجليزية، حيث أن استخدامها بلغات أخرى يعتبر تجريبياً وقد لا يعمل بشكل موثوق. نحن نعمل على تبسيط هذه العملية باستخدام الرموز التعبيرية (الإيموجي) والأزرار في التحديثات المستقبلية.
  4. حدود الأحرف والمحتوى الطويل: تم تصميم مربع توليد الصوت القياسي للمقاطع القصيرة ويتسع فقط لـ 1500 حرف (نوصي بـ ~200 حرف لكل عملية توليد للحصول على أفضل جودة).
  5. للكميات الكبيرة: إذا كنت ترغب في الحصول على صوت كقطعة واحدة متصلة دون الحاجة لإعادة التحرير أو التجميع—مثل الكتب الصوتية أو المقالات الطويلة—لا تستخدم مربع الإدخال هذا. بدلاً من ذلك، استخدم استوديو تحويل النص إلى صوت (Text to Audio Studio). يتيح لك الاستوديو رفع مستندات كاملة وأتمتة إنتاج المحتوى الطويل بكفاءة.

2

اختيار الصوت (Voice selection)

اختر الصوت الذي ترغب في استخدامه من قائمتك.

اختيار الصوت مهم؛ على سبيل المثال، إذا كنت تريد صوتاً يتحدث العربية الفصحى، فمن الأفضل اختيار صوت مخصص لذلك من البداية بدلاً من صوت مخصص للهجة عامية. ومع ذلك، هذا لا يعني أنك إذا اخترت صوتاً مخصصاً للهجة معينة أنه لن يقرأ النص بالفصحى؛ بل سيقرأه وقد يعطيه حيوية جيدة. ولكن، إذا قمت برفع معامل العاطفة (emotion parameter) أو الحرارة (temperature)، فقد يؤدي ذلك لنتائج غير متوقعة، حيث سيميل الصوت نحو اللهجة التي تم استنساخه عليها.

على سبيل المثال، لنفترض أنك تريد أداءً بلهجة محددة. في هذه الحالة، إذا لم ترغب في تفعيل معامل العاطفة واخترت صوتاً عامياً، فإن زيادة التعبيرية والحرارة ستقرب الأداء أكثر إلى اللهجة التي تريدها. في أي حال، الأداء الصوتي يبنى على سياق المدخلات؛ إذا فهم النموذج اللهجة المدخلة، فسيحاول محاكاتها وأدائها حتى لو لم يكن الصوت المختار متخصصاً في اللهجات. تذكر دائماً أنه كلما تدربت أكثر، ستفهم بشكل أفضل التوازن الذي يمكن تحقيقه من خلال معرفتك بالإعدادات وكيفية التعامل معها، مما يوصلك لنتائج مبهرة.

3

ضبط الإعدادات (اختياري)

قم بتعديل إعدادات الصوت للحصول على المخرجات المطلوبة.

الإعداد الافتراضي (Default) الذي نوصي به موضح في الصورة أدناه:

الإعدادات:

  1. معامل الإبداع (Temperature) :
  2. أعلى = مرونة أكثر
  3. أقل = أكثر جموداً
  4. زيادة الحرارة تعطي نموذج الذكاء الاصطناعي حرية أكبر للتحكم في الصوت، لكن رفع المستوى بشكل كبير قد يخاطر بظهور نتائج أداء غريبة؛ وخفضها إلى الصفر سيجعل الأداء الصوتي أكثر صلابة وخالياً من الحياة، لذا فإن ضبطها عند نقطة وسط مناسبة تلبي احتياجاتك هو الأفضل.
  5. التطابق: Similarity
  6. أعلى = مشابه للصوت الأصلي
  7. أقل = أقل شبهاً بالصوت الأصلي
  8. رفع معامل التطابق يزيد من الشبه بالصوت المستنسخ الأصلي؛ ومع ذلك، فإن رفعه للحد الأقصى عندما لا تكون العينة المرجعية نظيفة أو ذات جودة عالية يخاطر بإدخال تشوهات صوتية مثل الخشخشة. يمكنك ضبطه على الحد الأقصى إذا كنت بحاجة لتطابق تام بشرط أن تكون العينة نظيفة؛ وإلا، قم بخفضه للحصول على نتيجة أنقى وأفضل.
  9. السرعة: Speed
  10. أعلى = أسرع
  11. أقل = أبطأ
  12. زيادة سرعة الصوت للحد الأقصى أو تقليلها للحد الأدنى قد يقلل من جودة الصوت المولد؛ لذلك، نوصي بعدم اللجوء لهذا الخيار إلا عند الضرورة.


  1. التعبيرية: Expressiveness

  1. أعلى = إلقاء عاطفي
  2. أقل = نبرة محايدة
  3. رفع معامل العاطفة يقرب المخرجات من الأداء الطبيعي، لكن رفعه بشكل مفرط يخاطر بظهور سلوك غريب؛ لذلك، عند توليد الصوت بكميات كبيرة، خاصة في Voice Studio، نوصي بإبقائه عند الصفر ورفعه بشكل تجريبي على جمل محددة.

إعدادات العاطفة (Emotion Setting slides) :

الإعداد الافتراضي الذي نوصي به موضح في الصورة الجانبية:

إذا اخترت تفعيل العاطفة (Enable Emotion)، كما في الصورة أعلاه، فإن الإعداد الموصى به هو رفع درجة الحرارة (Temperature).

4

اختر نمط المعالجة المطلوب (Normalization)

  1. أساسي (Basic): مناسب للغة العربية بدون أي إضافات عليها، ومناسب للغات الأخرى غير العربية.
  2. محسن بالذكاء الاصطناعي (Ai – Enhanced): مصمم خصيصاً للغة العربية، بحيث يفهم السياق، ويقسم الجملة أو الفقرة، ويطبق التشكيل الضروري المناسب للنطق.

5

توليد (Generate)

انقر على زر Run (توليد) في صفحة Text to Audio أو على زر Generate (توليد) في Text to Audio Studio لإنشاء ملفك الصوتي. في الاستوديو، يمكنك توليد آلاف الأسطر دفعة واحدة بالنقر على زر الدمج (merge).

انتقل إلى المقالة التالية في دليل مكنة


خ

خالد محمود

هل استمتعت بهذا المقال؟

اشترك في نشرتنا الإخبارية لتلقي أحدث الأفكار والتحديثات حول تقنية الصوت العربية.

نحن نحترم خصوصيتك. يمكنك إلغاء الاشتراك في أي وقت.