من الفكرة إلى الصوت والموسيقى والصورة المتحركة
في السنوات الأخيرة، لم يعد إنتاج المحتوى الوثائقي حكرًا على فرق ضخمة أو ميزانيات عالية. الذكاء الاصطناعي اليوم يتيح لصانع محتوى فردي أن ينتج فيلمًا وثائقيًا إنسانيًا، مشوقًا، وسينمائيًا، بالاعتماد على الأوامر النصية فقط.
هذا المقال يستعرض المنهج الكامل لصناعة وثائقي قصير، مستندًا إلى مثال عملي:
“ماذا يحدث للعقل عند التوتر المستمر؟ وربط الحياة الحديثة بالإرهاق الذهني.”
ويمكنك أيضا مشاهدة التطبيق العملي مباشرة من خلال الفيديو
أولًا: اختيار الفكرة الوثائقية (الفكرة قبل التقنية)
المحتوى الوثائقي الناجح لا يبدأ بالأدوات، بل بسؤال إنساني بسيط وليكن على سبيل المثال الذي سنطرحه
ماذا يحدث داخل العقل عندما يعيش تحت ضغط مستمر؟
ثانيًا: كتابة السكريبت باستخدام الذكاء الاصطناعي
السكريبت يجب أن يكون:
- قصير الجمل
- هادئ الإيقاع
- إنساني لا خطابي
- مناسب للتعليق الصوتي
وللحصول على اللإحترافي من شات جي بي تي قمت بكتابة الأمر التالي :
اريد ان تقوم بكتابة سكريبت مشوق وجذاب لايمل منه المشاهد او المستمع تحت هذا العنوان: العقل تحت الضغط ماذا يحدث للعقل عند التوتر المستمر؟ ربط الحياة الحديثة بالإرهاق الذهني. مناسب للطرح الإنساني الهادئ. يكون الاسكريبت مدته لاتزيد عن دقيقة . قم بتقسيمه الي اجزاء
مثال سكريبت (أقل من دقيقة – مُقسم لأجزاء)
الافتتاح:
العقل لم يُخلق ليكون تحت ضغط دائم.
لكن اليوم… نادرًا ما يرتاح.
التفسير:
عند التوتر المستمر، العقل لا ينهار فجأة،
بل يتعب بصمت.
الربط بالحياة الحديثة:
نحن لا نواجه أخطارًا حقيقية،
لكن عقولنا تتعامل مع الضغط كأنه تهديد دائم.
الخاتمة:
الهدوء ليس رفاهية،
بل حاجة بيولوجية.
ثالثًا: تحويل السكريبت إلى مشاهد بصرية (Visual Prompts)
بعد النص، ننتقل إلى الصورة.
كل جزء من السكريبت يقابله مشهد أو أكثر.
قم بسؤال جي بي تي : اريد اوامر نصية بصرية لكل جزء
وإذا كنت تريد أكثر من مشهد للجزء الواحد قم بكتابة الآتي: اعطني اكثر من مشهد لكل جزء حتى اقوم باطالة مدة الفيديو
مثال أمر نصي بصري (مشهد الافتتاح)
A cinematic close-up of a person sitting alone in a dark room,
soft blue phone light reflecting in tired eyes,
modern loneliness,
documentary cinematic style,
muted colors,
film grain,
16:9 aspect ratio
مثال مشهد رمزي للعقل
Abstract cinematic visualization of a human brain made of light and shadow,
soft pulses of light moving slowly,
symbolic mental fatigue,
scientific documentary style,
dark calm background,
16:9
رابعًا: تحريك المشاهد وتحويلها إلى فيديو (Motion Prompts)
الصورة وحدها لا تكفي. الوثائقي يعتمد على الحركة البطيئة. لذلك لكي يعطيك شات جي بي تي أمر احترافي قم بسؤاله: اريدك ان تقوم بتحريك كل مشهد بصري لتحويله الي فيديو
مثال أمر تحريك مشهد
Slow cinematic push-in camera movement toward the face,
subtle blinking,
soft phone light flickering gently,
minimal movement,
quiet breathing,
very slow pacing,
16:9
مثال تحريك مشهد المدينة
Wide cinematic shot of a modern city at night,
fast-moving traffic in time-lapse,
one person standing still in the center,
slow camera orbit around the subject,
contrast between speed and stillness,
16:9
بهذه الطريقة يمكن إطالة مدة الفيديو دون تكرار أو ملل، عبر تنويع الزوايا والحركات.
خامسًا: تصميم الصوت (التعليق الصوتي)
الصوت عنصر أساسي في الوثائقيات.
وصف احترافي لصوت التعليق
- نبرة عميقة نسبيًا
- هادئة، غير متعجلة
- إلقاء بطيء مع وقفات قصيرة
- إحساس إنساني تأملي
- بلا مبالغة درامية
جملة اختبار للصوت
“العقل لا يصرخ عندما يتعب…
بل ينسحب بصمت.”الأمر الذي استخدمته لتصميم صوت رجولي رخيم:
وصف الصوت الوثائقي (Voice Description)
صوت رجولي/محايد عميق نسبيًا،
نبرة هادئة وواثقة، غير متعجلة،
طبقة صوت دافئة مع حضور منخفض ومريح للأذن،
خالي من المبالغة الدرامية أو الأداء الإذاعي،
إلقاء بطيء ومدروس، مع وقفات قصيرة بين الجمل،
وضوح عالي في مخارج الحروف دون حدة،
إحساس تأملي إنساني، كأنه يهمس بالحقيقة لا يفرضها،
يوحي بالمعرفة والطمأنينة، لا بالتحذير أو التهويل،
مناسب للقصص العميقة، النفسية، والوجودية،
يشبه أسلوب المعلّقين في وثائقيات Netflix وArte.
إعدادات أداء مقترحة (لأفضل نتيجة)
- السرعة: بطيئة إلى متوسطة
- الحدة (Pitch): منخفضة قليلًا
- التنغيم: مستوٍ مع تغيرات طفيفة جدًا
- الوقفات: 0.5 – 1 ثانية بعد الجمل المهمة
- العاطفة: هدوء + تعاطف + عمق
سادسًا: توليد موسيقى الخلفية بالذكاء الاصطناعي
الموسيقى يجب أن:
- تُشعر ولا تُسمع
- لا تنافس الصوت
- تعكس الضغط الذهني بهدوء
الأمر النصي لتوليد الموسيقى
Calm cinematic documentary background music,
slow tempo,
minimalistic composition,
deep atmospheric pads,
soft piano notes spaced with silence,
subtle low-frequency drones representing mental pressure,
no vocals,
emotional but restrained tone,
modern life stress,
ambient cinematic soundscape,
60–70 BPM
سابعًا: المونتاج والإيقاع النهائي
- مدة كل مشهد: 6–8 ثوانٍ
- انتقالات بطيئة (Cross Dissolve)
- الموسيقى منخفضة جدًا
- الصمت جزء من السرد
النتيجة:
وثائقي قصير، إنساني، قابل للمشاهدة حتى النهاية دون إرهاق.
وأخيرا يمكن القول:
الذكاء الاصطناعي لا يصنع الوثائقي بدل الإنسان،
بل يمنحه الأدوات ليحوّل الفكرة الإنسانية إلى:
- نص
- صورة
- حركة
- صوت
- موسيقى
وكل ذلك… من خلال أوامر نصية مدروسة.
