B-roll научпоп начинается с одного ключевого слова темы: система автоматически собирает материалы, пишет текст озвучки, создаёт двуязычную TTS-начитку на китайском и английском, затем разбирает каждую фразу до уровня подлежащего, сказуемого и дополнения для подбора видеоряда, точно вставляет изображения известных картин, убирает повторы и прожигает субтитры. В этом кейсе темой стал «импрессионизм»: после нескольких раундов доработки визуала на выходе получилось 76-секундное горизонтальное научно-популярное видео, где каждая фраза синхронизирована с изображением.




Достаточно указать ключевые слова научно-популярной темы, и Skill автоматически параллельно собирает материалы из нескольких источников, выделяет главное и генерирует сценарий озвучки — без какой-либо подготовки исходников со стороны пользователя.
Skill автоматически подбирает стиль озвучки под характер материала и в один клик создаёт качественное TTS-аудио на китайском и английском, с интонацией, подходящей и для документального формата, и для научпоп-блога.
Планирование видеоряда можно детализировать до уровня подлежащего, сказуемого и дополнения для каждой строки субтитров: если упоминается «критик», появляется кадр с критиком, если «работы Моне» — соответствующая картина. Никакого рассинхрона между текстом и изображением.
Skill отслеживает каждый уже использованный материал и автоматически избегает повторов; также поддерживает тонкие ритмические команды вроде быстрой нарезки для параллельных конструкций или мгновенного появления существительных, делая монтаж заметно профессиональнее.
Озвучка, B-roll и прожжённые субтитры собираются в одном процессе, а на выходе сразу получается готовое к публикации горизонтальное научпоп-видео без дополнительного монтажа в стороннем редакторе.