字节跳动发布Infinity:自回归文生图新突破,性能超越扩散模型

近日,字节跳动宣布开源其最新研发的文生图大模型Infinity,并声称该模型在图像生成质量上取得了显著提升,超越了当前流行的Stable Diffusion3模型。Infinity模型的创新之处在于其采用了Bitwise Token的自回归框架,这一框架能够更加精准地预测下一级分辨率的+1或-1细粒度“Bitwise Token”,从而使得生成的图像细节更加丰富。此外,Infinity模型还实现了词表的无限扩展,极大地增强了Image tokenizer的表示空间,为自回归文生图技术的发展开拓了新的可能性。在性能对比中,Infinity模型表现出色,不仅在自回归方法中领先于HART、LlamaGen、Emu3等模型,还在与HART模型的人评测试中取得了接近90%的胜率。这一系列成果标志着字节跳动在人工智能技术研究上的又一重要里程碑,也为图像生成领域带来了新的突破。