c2c网站代表河北网站制作公司报价
2025/12/23 22:15:32 网站建设 项目流程
c2c网站代表,河北网站制作公司报价,区块链技术和网站开发结合,怎么给wordpress切图鱼羊 发自 凹非寺量子位 | 公众号 QbitAI何恺明团队新作#xff0c;持续聚焦Flow模型。与MeanFlow对流匹配的优化不同#xff0c;这次主要旨在解决归一化流在生成模型中的局限。论文提出名为双向归一化流#xff08;BiFlow#xff09;的新框架#xff0c;通过解耦前向过程…鱼羊 发自 凹非寺量子位 | 公众号 QbitAI何恺明团队新作持续聚焦Flow模型。与MeanFlow对流匹配的优化不同这次主要旨在解决归一化流在生成模型中的局限。论文提出名为双向归一化流BiFlow的新框架通过解耦前向过程——将数据映射为噪声和逆向过程——把噪声再转回来生成图片成功打破了传统归一化流生成模型效率低下的问题。值得一提的是论文的三位一作分别是来自清华姚班和MIT的本科生。BiFlow逆向过程不必是前向过程的精确逆运算归一化流方法NFs已经成为生成建模的一种原则性框架。标准的归一化流包含前向过程和逆向过程前向过程将数据映射为噪声逆向过程则通过对前向过程求逆来生成样本。传统的NF模型有一个硬性规定逆向过程必须是前向过程的精确逆运算——要像钥匙和锁一样完全匹配。这就导致了两个问题模型设计受限因为要保证 “可逆”不能使用很多强大的通用架构比如视觉Transformer得特意设计复杂结构推理速度慢由于架构约束归一化流通常需要比其他模型更深、更宽的网络才能达到相似效果。以TARFlow为例逆向生成时需要一步步按顺序计算并且无法并行加速。BiFlow的核心创新就在于打破了“逆向过程必须是前向过程的精确逆运算”这一规则。设计思路是这样的BiFLow解耦了前向过程和逆向过程的设计。前向模型仍然使用易于训练的流模型如改进版TARFlow将数据映射为噪声。逆向模型则引入一个可学习的独立模型来近似前向模型的逆映射。由此逆向模型不需要是前向模型的数学精确逆可以使用任意架构如非因果的双向Transformer来实现并行化和高效计算。逆向模型也可以在单次前向传递中直接从噪声生成图像无需像自回归模型那样逐步生成。具体来说何恺明团队的这篇新论文提出了三项关键技术。隐藏层对齐Hidden Alignment为了解决独立逆向模型容易跑偏的问题论文提出了一种新的损失函数策略既利用了全轨迹监督又保持了架构的灵活性利用前向过程的完整中间状态轨迹数据→半噪声→纯噪声作为监督信号通过可学习的投影头将逆向模型的中间状态与前向状态对齐。学习去噪Learned Denoising传统NF方法如TARFlow推理时需要额外去噪会增加计算量。BiFlow将去噪步骤直接整合进逆向模型的一个额外模块中实现了“端到端”的从噪声到清晰数据的映射消除了额外的推理开销。训练时无分类器引导Training-time CFG为了在推理时保持单步生成1-NFE的高效性BiFlow在训练阶段就引入了无分类器引导CFG让模型学习以CFG比例为条件的生成从而避免了推理时计算两次前向传播的成本。实验结果速度提升两个数量级实验结果显示在生成质量方面BiFlow在ImageNet 256×256数据集上取得了2.39的FID分数刷新目前基于NF方法的SOTA。在推理速度方面相比于基线方法改进版TARFlowBiFlow的采样速度提升了两个数量级在TPU上快697倍。另外BiFlow凭借双向映射特性无需额外训练即可实现图像修复和类别编辑两类图像编辑任务。本科生领衔BiFlow有两位项目负责人。陆伊炀江苏南通人清华姚班大二本科生目前在MIT计算机科学与人工智能实验室CSAIL实习导师是何恺明主要研究方向为计算机视觉和深度生成模型。高中时期他是物理竞赛生曾以江苏选手中第一名、全国第九名的成绩在2022年获得了第三十九届全国中学生物理竞赛CPhO金牌。Qiao SunMIT大二本科生目前是何恺明计算机视觉课题组的本科生研究机会项目UROP学生。研究主要集中在生成模型方面如扩散模型、流匹配等。Qiao Sun高中毕业于上海中学是2023年国际数学奥林匹克竞赛IMO金牌得主。论文的另一位一作是王衔邦今年刚从人大附中毕业进入MIT学习。他的导师同样是何恺明。王衔邦还是一名双料竞赛生在2024年IMO上摘得金牌还在2021年和2022年获得过全国信息学奥林匹克竞赛的银牌。论文地址https://arxiv.org/abs/2512.10953v1一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完— 点亮星标 科技前沿进展每日见

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询