Upscale-A-Video视频放大算法
Upscale-A-Video的文本引导潜在扩散框架,用于视频放大。该框架通过两个关键机制确保时间上的一致性:在局部上,它将时间层集成到U-Net和VAE-Decoder中,保持短序列的一致性;
在全局上,引入了一个基于流引导的经常性潜在传播模块,通过在整个序列中传播和融合潜在来增强整体视频的稳定性。
由于扩散范式,模型还通过允许文本提示来引导纹理创建和可调噪声水平来平衡恢复和生成,从而在保真度和质量之间实现权衡。
© 版权声明
文章版权归作者所有,未经允许请勿转载。