Partendo dal tema "Come fanno i camaleonti a cambiare colore?", lo Skill ha gestito automaticamente la ricerca dei contenuti, scritto il testo del voiceover e generato la narrazione TTS. Ha poi pianificato 7 schede informative animate, le ha sovrapposte, renderizzate e ha impresso i sottotitoli per produrre un video scientifico orizzontale di 67 secondi. Durante tutto il processo, all'utente è bastato approvare lo script e il piano delle schede: a tutto il resto ha pensato lo Skill.


All'utente basta fornire una parola chiave. Lo Skill recupera quindi da più fonti, nello stesso momento, le conoscenze scientifiche essenziali e le distilla in concetti visualizzabili, senza che l'utente debba preparare materiali o testi.
Il testo del voiceover viene organizzato automaticamente in una struttura in tre parti: "aggancio controintuitivo → spiegazione del meccanismo → spunto finale", con un tono parlato naturale che si adatta a formati da 60 secondi fino a 5 minuti.
In base allo stile del contenuto, lo Skill sceglie automaticamente voce e velocità di parlato tra un tono documentaristico e uno da creator scientifico. Per cinese e inglese vengono abbinate voci coerenti, senza bisogno di selezione manuale.
Una volta completato il TTS, lo Skill genera contemporaneamente un file di sottotitoli con marcature temporali. Può anche correggere refusi e sistemare la punteggiatura, così i sottotitoli restano perfettamente allineati alla narrazione.
Per i concetti chiave e i dati presenti nello script, lo Skill pianifica schede dinamiche come Keyword, Compare e LowerThird. Dopo la conferma dell'anteprima basata sui fotogrammi, le sovrappone al video con ffmpeg e imprime i sottotitoli, così la densità informativa sullo schermo resta sincronizzata con il ritmo della narrazione.