
10月15日,百度旗下视频生成模型“蒸汽机”完成重大升级178炒股配资,行业首次实现AI长视频实时交互生成。依托流式视频技术突破,该模型不仅打破传统AI视频10秒左右的时长限制,更将生成模式从“单向输出”升级为“双向共创”,重新定义AIGC内容创作范式。

此次升级核心采用流式生成技术与动态缓冲区管理机制,通过帧级噪声独立控制与历史参考帧优化,实现理论上“无限时长”视频生成,画面连贯性较传统“首尾帧续写”技术显著提升——西部牛仔风格视频中,人物行走、镜头摇移等复杂运镜可实现一镜到底的丝滑过渡。生成速度上,经工程优化的模型推理效率超越国内主流产品,较Vidu2.0等模型“10秒生成4秒视频”的效率实现质的飞跃。

交互体验方面,用户上传单张图片与提示词即可启动生成,过程中可随时暂停或修改提示词,实时调控视频剧情、画面及转场效果。例如生成赛车动画时,中途调整提示词即可让赛车顺序调整,背景切换,全程无需重新渲染。这种“无限画布”式创作,使AI视频从被动素材生成工具转变为实时协作的创作伙伴。
同步推出的两大功能进一步拓展应用边界:
可交互数字人:支持沉浸式双向互动与情感识别,可应用于AI导购、教育、陪伴等场景,如导购场景中能根据用户提问实时调整产品演示;
开放世界动态构建:允许用户自行操控,在AI生成的游戏地图、旅游景点、宇宙空间等环境中自由探索,场景细节随交互实时渲染,解决传统预生成内容的僵化问题。
百度蒸汽机自5月起持续迭代,先后实现音视频一体化生成、多人对话生成、移动端适配等能力。本次长视频实时交互功能的推出,进一步拓展AI视频在影视预演、互动娱乐、个性化营销等场景的应用边界,推动AIGC从“素材生成工具”向“内容共创平台”演进。
百度商业研发总经理刘林表示,长时一致性与实时交互技术的结合,标志着AIGC从“素材生产”向“内容共创平台”的关键跨越。
业内分析指出,该技术将加速AI视频在互动娱乐、虚拟社交等领域落地178炒股配资,推动内容产业进入“低门槛、高创意”新阶段。(转自AI普瑞斯)
新钰优配提示:文章来自网络,不代表本站观点。