分类目录归档:行业

扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得

原文链接:
扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得


1. 论文核心方法

提出Nabla-GFlowNet框架,通过梯度感知的流平衡条件(Nabla-DB)微调Stable Diffusion模型,在保持生成多样性的同时优化美学评分(Aesthetic Score)等奖励函数。

2. 技术亮点

– 将扩散过程建模为动态水流系统,通过残差去噪网络(Residual Nabla-DB损失函数)平衡奖励梯度与预训练模型先验。

– 创新参数化设计:利用单步去噪估计替代额外网络,简化对数流梯度计算。

3. 实验结果

定性分析:相比ReFL、DRaFT等方法,Nabla-GFlowNet生成的图像奖励更高且避免过拟合,保留自然性。

定量指标:在Aesthetic Score、HPSv2等任务中,DreamSim多样性指标提升,FID分数更低。

4. 对比优势

– 直接奖励优化方法(如DRaFT)易过拟合,传统强化学习(如DDPO)效率低下;

– Nabla-GFlowNet收敛更快,且能稳定保持预训练模型的多样性和先验分布。

5. 资源链接

– 论文地址:arXiv
– 代码开源:GitHub

3D领域「源神」又开了两个新项目:三维部件编辑与自动绑定框架

原文链接:
3D领域「源神」又开了两个新项目:三维部件编辑与自动绑定框架


1. VAST开源两大3D生成项目
国内创业公司VAST开源了HoloPartUniRig两大3D工具。HoloPart专注于三维模型部件分割与补全,UniRig则是通用自动绑定框架。

2. HoloPart的核心突破
• 首创三维部件完整语义分割技术,能推断被遮挡部件的完整几何结构
• 采用双重注意力机制(局部+上下文感知),在Objaverse等数据集预训练
• 实验显示性能显著优于现有方法,支持直观编辑/材质分配/动画制作等下游应用

3. UniRig的技术创新
• 通过骨骼树Tokenization将3D骨骼结构转化为Transformer可处理的序列
• 自研Rig-XL数据集(14,000+模型)提升泛化能力
• 实现215%关节预测精度提升,1-5秒快速推理

4. 行业价值
两项技术解决了3D内容生产的部件编辑自动绑定核心痛点,为国产3D大模型发展奠定重要基础。

智谱 Agent OpenDay 技术前沿进展总结

智谱 Agent OpenDay 技术前沿进展总结

  1. 技术突破方向
    • 功能进化:从单纯对话的 Chatbot 迈向 “有手、有脑、有眼睛” 的自主 Agent,智谱在 Agent 技术革新中成果斐然,为人类与机器互动模式带来质的转变。
    • 模型演进:定义大模型发展五阶段(L1 语言能力至 L5 探究科学规律),Agent 推动工具使用能力提升与自我学习探索,成 LLM – OS 雏形,预示人机交互新纪元。
  2. AutoGLM 卓越性能
    • 复杂任务处理
      • 超长任务:精准领会并高效执行超长指令任务,多步循环任务处理速度优于人工,突破任务长度与效率瓶颈。
      • 跨 App 协作:充当用户与应用间关键调度层,跨越多个 App 无缝执行任务,拓展应用交互边界。
      • 指令简化:“短口令” 功能将复杂任务指令凝练成简洁短语,如 “点咖啡” 替代冗长饮品订单,提升交互便捷性。
      • 智能决策:“随便模式” 化解选择困境,AI 自主决策任务步骤,为用户带来意外惊喜与全新体验。
    • 产品推进规划
      • 大规模内测启动:广泛征集百万用户参与测试,深度优化产品性能与用户体验,为正式上线夯实基础。
      • 市场合作拓展:实施 “10 个亿级 APP 免费 Auto 升级” 战略,携手 App 伙伴挖掘创新应用场景,构建多元生态。
      • 平台试用上线:核心 API 入驻智谱 MaaS 开放平台,供开发者试用,降低开发门槛,加速技术普惠。
    • Web 智能上网革新:智谱清言插件集成 AutoGLM,实现数十网站 “无人驾驶” 式交互,从搜索信息到内容互动全流程自动化,如自动搜索影视、播放剧集并发弹幕打卡,革新网络使用模式。
  3. GLM – PC 创新探索
    • 内测场景多元
      • 会议管理助手:智能预订会议、精准发送总结,提升会议组织与信息流转效率,优化办公流程。
      • 文档智能处理:涵盖下载、发送、内容理解与总结功能,实现文档全生命周期智能管控,助力知识管理。
      • 网络信息整合:跨多平台搜索关键词并深度总结,一站式信息收集分析,成为用户专属信息中枢。
      • 远程智能操控:手机远程指挥,支持定时任务,解锁设备远程管理新维度,增强使用灵活性与自主性。
      • 隐形屏幕协作:后台智能运行任务,释放屏幕资源,达成高效并行处理,提升设备多任务处理能力。
    • 发展愿景展望:虽当前指令精度要求较高,但技术持续迭代,有望成为通用 PC 智能助手,实现 “一句话操作电脑” 愿景,重塑人机交互准则。
  4. 产业协同展望
    • 行业趋势洞察:苹果、Anthropic 等巨头聚焦 Agent,2025 年成行业爆发节点,Gartner 预测其将深度变革工作决策模式,2028 年承担 15% 日常决策,凸显 Agent 战略价值。
    • 智能设备变革:智谱 COO 张帆展望 AI 赋能手机、PC、汽车等设备转型,催生随身助理、生产力工具、智能生活空间,端侧技术升级与协同架构优化将加速 AI 原生设备互联融合,开启智能网络新时代,智谱以技术产品为引擎,驱动行业创新发展。