À partir d’un simple mot-clé de thème, B-roll éducatif collecte automatiquement les sources, rédige le script de voix off, génère une narration TTS bilingue chinois-anglais, puis décompose chaque phrase jusqu’au niveau sujet-verbe-objet pour faire correspondre les images, insérer précisément des œuvres célèbres, supprimer les répétitions et incruster les sous-titres. Ici, sur le thème de l’« impressionnisme », plusieurs cycles d’ajustement visuel ont permis d’aboutir à une vidéo éducative horizontale de 76 secondes, où chaque image est alignée phrase par phrase avec le texte.




Il suffit de fournir un mot-clé de sujet éducatif : le Skill recherche automatiquement du contenu dans plusieurs sources en parallèle, en extrait l’essentiel puis génère un script de voix off, sans que l’utilisateur ait à préparer le moindre matériau.
Le Skill choisit automatiquement le style de narration selon le ton du contenu et permet de générer en un clic un audio TTS de haute qualité en chinois et en anglais, avec une intonation adaptée aussi bien au style documentaire qu’aux créateurs de vulgarisation.
Chaque sous-titre peut être affiné jusqu’au niveau sujet-verbe-objet pour planifier les visuels, afin de garantir qu’un « critique » affiche bien un critique, qu’une « œuvre de Monet » fasse apparaître le tableau correspondant, et d’éliminer les décalages entre image et texte.
Le Skill suit chaque média déjà utilisé pour éviter automatiquement les répétitions ; il prend aussi en charge des consignes de rythme très fines, comme les coupes rapides sur phrases parallèles ou les apparitions flash de noms, pour un montage final plus professionnel.
L’audio de narration, les visuels B-roll et les sous-titres incrustés sont assemblés dans un seul et même flux de production, pour sortir directement une vidéo éducative horizontale prête à être publiée, sans logiciel de montage supplémentaire.