Das B-roll-Erklärvideo startet mit einem einzigen Themenwort, sammelt automatisch Informationen, schreibt den Sprechertext, erzeugt zweisprachige TTS-Vertonung auf Chinesisch und Englisch und zerlegt anschließend jeden Satz bis auf die Ebene von Subjekt, Prädikat und Objekt, um passende Bilder zuzuordnen, berühmte Gemälde gezielt einzufügen, Material zu deduplizieren und Untertitel einzubrennen. Diesmal lautete das Thema „Impressionismus“: Nach mehreren Runden der Bildoptimierung entstand schließlich ein 76 Sekunden langes Erklärvideo im Querformat, bei dem Bild und Text Satz für Satz exakt aufeinander abgestimmt sind.




Du gibst nur ein Themenkeyword für ein Erklärthema vor, und das Skill recherchiert automatisch parallel aus mehreren Quellen, verdichtet die Kerninformationen und erstellt daraus ein Sprechertext-Skript – ganz ohne vorbereitete Materialien.
Das Skill wählt den passenden Voice-over-Stil automatisch anhand der inhaltlichen Tonalität aus und erzeugt per Klick hochwertige TTS-Audios auf Chinesisch und Englisch, mit einer Intonation passend für Doku- oder Wissenschafts-Content.
Jede Untertitelzeile kann bis auf die Ebene von Subjekt, Prädikat und Objekt für die Bildplanung aufgeschlüsselt werden, sodass bei "Kritiker" auch ein Kritiker erscheint und bei "Werke von Monet" das passende Gemälde – kein Verrutschen mehr zwischen Bild und Text.
Das Skill verfolgt jedes bereits verwendete Material und vermeidet Wiederholungen automatisch. Außerdem unterstützt es feingranulare Rhythmusvorgaben wie schnelle Schnitte bei Aufzählungen oder das punktgenaue Einblenden von Begriffen, damit der fertige Film professioneller geschnitten wirkt.
Voice-over-Audio, B-roll-Bilder und eingebrannte Untertitel werden in einem einzigen Ablauf zusammengeführt und direkt als veröffentlichungsfertiges Erklärvideo im Querformat ausgegeben – ganz ohne zusätzliche Schnittsoftware.