Partindo do tema "Como os camaleões mudam de cor?", a Skill cuidou automaticamente da pesquisa de conteúdo, escreveu o roteiro da locução e gerou a narração em TTS. Depois, planejou 7 cartões informativos animados, sobrepôs e renderizou tudo, e inseriu as legendas para produzir um vídeo científico horizontal de 67 segundos. Ao longo do processo, o usuário só precisou aprovar o roteiro e o plano dos cartões — todo o resto foi feito pela Skill.


O usuário só precisa fornecer uma palavra-chave. A Skill então busca conhecimento científico essencial em várias fontes ao mesmo tempo e o transforma em conceitos visualizáveis, sem que o usuário precise preparar materiais ou textos.
O roteiro da locução é organizado automaticamente em uma estrutura de três partes: "gancho contraintuitivo → explicação do mecanismo → insight final", com um tom de fala natural que se adapta a formatos de 60 segundos a 5 minutos.
Com base no estilo do conteúdo, a Skill escolhe automaticamente a voz e a velocidade da fala entre um tom de documentário e um tom de criador de conteúdo científico. Chinês e inglês recebem vozes adequadas, sem necessidade de seleção manual.
Assim que o TTS é concluído, a Skill gera ao mesmo tempo um arquivo de legendas com marcação de tempo. Ela também pode revisar erros de digitação e ajustar a pontuação para que as legendas permaneçam perfeitamente alinhadas com a narração.
Para os conceitos-chave e dados do roteiro, a Skill planeja cartões dinâmicos como Palavra-chave, Comparação e LowerThird. Após a confirmação da prévia quadro a quadro, ela os sobrepõe ao vídeo com ffmpeg e insere as legendas permanentemente, para que a densidade de informação na tela acompanhe o ritmo da narração.