基于 AI 文案生成 + TTS 语音合成 + 智能配图 + FFmpeg 合成的全自动流水线, 从一个关键词到完整短视频,全程无需人工干预。
基于 LLM 自动生成结构化视频脚本,支持单人讲解和对话两种风格
集成 Edge TTS 引擎,多种中文音色可选,支持语速调节
DALL-E 自动生成简笔画/插画风格配图,与文案内容智能匹配
FFmpeg 引擎合成:纯色背景 + 3D 标题 + 自动字幕 + 背景配乐