ArcTable系列02 我去掉了ltx2.3的音频模型的批量测试对比


上期的视频我说过想用1秒的首尾帧视频进行拼接,但是模型根本抓不住画面逻辑,全是废片。
于是我又开始到处找其他的方案,改用 LTX2.3 官方工作流,直接删掉音频模块。
先解决 0→1 出片,音效后期有需要再加;显卡性能匹配轻量化管线,速度直接拉满。
我们先用image_z_image_turbo模型生成864*480的图,

然后分别用3个不同的工作流批量生成视频,分别是ltx2.3无音频工作流,ltx2.3官方带音频工作流还有wan2.2,视频时间都为5秒.
话说,这个image_z_image_turbo模型生图速度还是极快的,3秒一张图.

ltx2.3无音频视频生成大概在40秒左右

终于生成完ltx2.3官方带音频工作流了,真是痛苦无比 ,最低时间都要50秒,高的需要180秒,极其不稳定,可能是因为我的4090的24gb显存跟32gb内存的一直在交互吧,总而言之超过了我的电脑算力了

wan2.2 补帧乘2工作流,并且我只能跑4秒,因为电脑温度都上80了,高温常态会影响硬件寿命的,显卡老贵了,舍不得跑呢,基本上在60秒左右,测试制作不易,还请看到这里的老铁们给个点赞3连,下面就请看成品视频了