智谱技术团队最新发布的视频模型 CogVideoX v1.5,相较于之前的版本,增加了生成能力,能够生成5/10秒、768P、16帧的视频。此外,该模型还支持任意尺寸比例,并且其图生视频质量及复杂语义理解能力也得到了大幅提升。
官方介绍称,CogVideoX v1.5将同步上线到“清影”平台,并与新推出的 CogSound音效模型结合,“新清影”具备如下特性:
1. 质量提升:在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力显著增强。
2. 超高清分辨率:支持生成10s、4K、60帧超高清视频。
3. 可变比例:支持任意比例,从而适应不同的播放场景。
4. 多通道输出:同一指令/图片可以一次性生成4个视频。
5. 带声效的AI视频:新清影可以生成与画面匹配的音效。
这款新清影开源代码位于github.com/thudm/cogvideo中,而模型则可在huggingface.co/THUDM/CogVideoX1.5-5B-SAT上获得。
本文属于原创文章,如若转载,请注明来源:告别“默片”:智谱发布新清影,可生成10秒4K60帧/自带音效视频https://ai.zol.com.cn/916/9164617.html