导读:SRPO项目旨在解决AI生图中的塑料感和虚假味道
真正懂人类的审美!腾讯混元团队发布文生图模型 SRPO,重点解决 AI 生图长期被诟病的“塑料感”和“虚假味”,显著提升生成图像的人类评估真实感和审美质量。
SRPO 是由腾讯公司混元团队、香港中文大学(深圳)理学院、清华大学深圳国际研究生院于 2025 年 9 月共同推出的文本到图像生成模型,通过将奖励信号设计为文本条件信号,实现对奖励的在线调整,减少对离线奖励微调的依赖。
SRPO 引入 Direct-Align 技术,通过预定义噪声先验直接从任何时间步恢复原始图像,避免在后期时间步的过度优化问题。
在 FLUX.1.dev 模型上的实验表明,SRPO 能显著提升生成图像的人类评估真实感和审美质量,且训练效率极高,仅需 10 分钟即可完成优化。其相关论文成果为「Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference」。
SRPO的GitHub地址:https://github.com/Tencent-Hunyuan/SRPO
感兴趣的AI开发者们不妨一试~
作者:超神经
本篇文章为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。