ينطلق شرح B-roll العلمي من كلمة مفتاحية واحدة، ثم يجمع المواد تلقائيًا، ويكتب نص التعليق الصوتي، وينشئ راوي TTS ثنائي اللغة بالصينية والإنجليزية، ثم يفكك كل جملة إلى مستوى الفاعل والفعل والمفعول لمطابقة المشاهد، ويُدرج لوحات الفن الشهيرة بدقة، ويزيل التكرار ويحرق الترجمة داخل الفيديو. في هذه الحالة، كان الموضوع هو «الانطباعية»، وبعد عدة جولات من صقل المشاهد، تم إخراج فيديو توعوي أفقي مدته 76 ثانية تتطابق فيه الصورة مع النص جملةً بجملة.




يكفي إدخال الكلمات المفتاحية للموضوع التوعوي، ليتولى Skill البحث المتوازي تلقائيًا عبر مصادر متعددة، واستخلاص المعلومات الأساسية ثم إنشاء نص التعليق الصوتي، من دون أن يجهز المستخدم أي مواد مسبقًا.
يختار Skill تلقائيًا أسلوب التعليق الصوتي وفق نبرة المحتوى، ويدعم إنشاء صوت TTS عالي الجودة بالصينية والإنجليزية بضغطة واحدة، مع نغمة تناسب سيناريوهات الوثائقيات أو صناع المحتوى التوعوي.
يمكن تفصيل تخطيط المشاهد لكل سطر ترجمة حتى مستوى الفاعل والفعل والمفعول، لضمان ظهور مشهد «الناقد» عند ذكر الناقد، وظهور اللوحة المناسبة عند ذكر «أعمال مونيه»، والتخلص من عدم تطابق الصورة مع النص.
يتتبع Skill كل مادة استُخدمت بالفعل ويمنع تكرارها تلقائيًا، كما يدعم تعليمات إيقاعية دقيقة مثل القطع السريع في الجمل المتوازية والظهور الخاطف للأسماء، ما يمنح الفيديو النهائي إحساسًا أكثر احترافية في المونتاج.
يتم دمج صوت الراوي ولقطات B-roll والترجمة المحروقة ضمن سير عمل واحد، مع إخراج فيديو توعوي أفقي جاهز للنشر مباشرة، من دون الحاجة إلى برامج مونتاج إضافية.