返回 hu86科技

AI视频生成革命!MIT领衔豪华天团让生成效率暴涨370%,成本直降4.4倍

2025-07-08

最近,MIT英伟达等研究人员发明的「径向注意力」技术,不仅让长视频生成速度提升3.7倍,还能把训练成本砍掉4.4倍。

在扩散模型的加持下,高质量视频生成逐渐从科幻变成现实。

但视频的时间维度给算力增加了不少负担,导致训练和推理长视频的成本飙升。

生成10秒视频就要烧掉数千元算力费用,价格之高令人望而却步。

对此,团队从热力学借了点灵感:「没有任何传播是无损的;信号、影响、注意力都会随着距离衰减。」

他们发现视频扩散模型里的注意力分数同样遵循这个规律——softmax后的权重随着token间的空间和时间距离递减。

这种「时空能量衰减」现象与自然界信号的物理衰减不谋而合。

这会不会就是视频生成降本增效的关键?

为进一步证实这种猜想,团队提出了「径向注意力」(Radial Attention):一种计算复杂度仅为O(nlog n)的稀疏注意力机制。

区别于之前SVG每次推理对空间/时间注意力进行动态选择,径向注意力用的是一种统一且高效的静态掩码。

这种掩码把空间和时间注意力合二为一,带来了更灵活、更快的长视频生成体验。

而且,这种简洁的静态注意力掩码让每个token只关注附近空间的邻居。随着时间距离的拉长,注意力窗口逐渐收缩。

相比传统的O (n²)密集注意力,径向注意力不仅大幅提升了计算效率,还比线性注意力拥有更强的表达能力。

在这项注意力机制创新的加持下,高质量视频生成变得更快、更长。

训练和推理的资源消耗极大地降低,为视频扩散模型打开了新的可能。

最新文章

荣耀WIN Turbo官宣定档5月29日,无风扇设计+万级电池引期待

数码

 

阅读10505

iQOO Pad6 Pro:4K板皇坐镇,5年流畅不卡顿

数码

 

阅读19092

千匹动力+限滑差速器,小米YU7 GT到底能不能越野?

汽车

 

阅读19701

直降1250元诚意拉满!索尼WH-1000XM6奶茶棕新色重磅上市

数码

 

阅读13677

全国首个家庭通用机器人拾光S1发布,解锁居家全能服务新体验

科技

 

阅读15541