出品 | 搜狐科技
作者 | 梁昌均
百度也在AI生成视频赛道卷起来了。
8月21日,百度宣布AI生成视频模型蒸汽机(MuseSteamer)迭代至2.0版本,并首次在行业内实现多人有声视频一体化生成。
据介绍,蒸汽机分为Turbo版、Lite版、Pro版及全系有声版,目前均全面开放,C端用户和企业用户均可使用。
百度副总裁、移动生态商业体系负责人陈一凡在和搜狐科技等媒体沟通中表示,百度布局AI生成视频是基于需求驱动,同时也是技术发展驱动。
“视频创作者和视频平台用户量存在一个量级差,很多人有想法,但不会创作,如果能提供工具,视频其实是一个最好的创作方式。”陈一凡说。
此次是在7月初首次发布后,百度AI生成模型时隔50天的又一次升级。陈一凡表示,此次主要在运镜、画质、一致性、音画一体生成等方面进行了优化,同时推动了成本下降。
在价格方面,百度蒸汽机价格低至行业70%,如Turbo版价格5秒视频价格是1.4元,而市面主流上是2元;有声版价格2.5元,限时两周优惠1.4元。
陈一凡解释称,成本优势主要得益于团队在技术和工程层面的积累和优化。
他介绍到,百度很早就开始用GPU进行搜广推训练,对以GPU为基础算力的架构非常熟悉,并在训练集、算子、算法策略等层面进行了优化,从而实现提质降本。
这有望带来视频创作成本的大幅下降。参与过《2012》、《黑客帝国3》、《三体》等影视特效制作的知名视效指导姚骐现场展示了百度蒸汽机2.0制作的科幻短片《归途》,按传统制作流程需耗资百万,但用AI仅花费330多元。
“AI生成视频的市场空间非常大,但用户创作的门槛还是挺高,我们1.4块生成一条视频,不能算是完全非常低,所以在成本上还会继续做优化。”
对于AI生成视频行业是否会出现类似大模型领域的价格战,陈一凡认为,企业都有比较重的算力成本,未来会且应该不断降本,这样才能让整个市场蓬勃起来。“如果其他玩家降,我们也会再降。”
随着百度入局AI生成赛道,意味着国内多家头部互联网公司,包括阿里、腾讯、字节、快手等将同台竞争。除了技术,商业化也将是竞争重点,其中快手可灵今年上半年已实现4亿元的收入。
对于AI生成视频接下来的技术突破,百度商业体系商业研发总经理刘林表示,未来会重点关注生成时长,从目前的5秒、10秒实现无限生成,同时实现更加自然的视频可交互,世界模型也是长远需关注的方向。
目前,市面主流的生成视频最长时长多数都在十多秒左右。刘林认为,这本质上是因为当前以扩散模型为主的技术架构,时长拓展会导致成本指数级增长。“我们现在正在研发下一代技术,将会是新的架构。”
在产品定位和商业探索上,陈一凡表示,蒸汽机是百度移动生态战略中的重要部分,不会考虑去做独立品牌,目前更多还是服务好B端企业和创作者,会先在百度搜索、营销等场景落地应用,并上线百度智能云千帆平台。
最新数据显示,目前百度移动搜索有超过64%的搜索包含AIGC内容。“降本之后更重要的一件事就是,要把百度APP要做成一个AIGC内容分发最友善的平台。”
陈一凡表示,现在百度搜索的视频化,加上信息流的视频化,百度APP可以说是一个视频平台,已有创作者利用蒸汽机生成的视频分发量达到几百万的量级。
在他看来,蒸汽机的商业收益空间是常规的视频模型调用空间的两个数量级,它会带来用户体验的提升、用户留存的增长,从而带来整个平台收益的增长。
在早前的百度Q2财报会上,李彦宏等高管表示,以AI为核心重塑产品仍是战略重点,百度搜索初期会保守推进,优先保障体验,短期业务承压,长期空间巨大。
“如果它能带来搜索一个点收入的提升,那是几十亿级别的数字。现在已经看到一些收益,我们接下来会继续投入。”陈一凡表示。
谈及市场竞争,他表示,百度入局AI生成视频是基于需求驱动,不会对此焦虑。“未来空间比现在能看到的要大得多,大模型离真正的AGI还非常远。”
“我们非常欢迎大家在这个赛道去卷,技术发展非常快,不卷不可能做好,这是一个需要去互相启发,去持续突破上限的过程。”陈一凡说。