作者归档:admin

突发,美商务部叫停「AI扩散规则」藏杀机!英伟达市值再破3万亿

原文链接:
突发,美商务部叫停「AI扩散规则」藏杀机!英伟达市值再破3万亿

中美AI芯片贸易战升级:美国废止AI扩散规则并加码出口管制

《AI扩散规则》正式被废止

美国商务部于5月13日宣布撤销拜登签署的《AI扩散规则》(原定5月15日生效)。该规则曾试图通过将全球划分为三级芯片供应体系(盟友自由获取、120国受算力限制、中国全面禁运),主导AI产业秩序。此举引发英伟达、甲骨文等科技巨头及美国盟友强烈反对,认为其阻碍全球竞争力并损害外交关系。

特朗普政府推出精准打压措施

新政策同步加码半导体管制,三大核心内容聚焦:
1. 禁止全球任何地区(包括中国企业)使用华为设计的AI芯片;
2. 警告国际云服务商(如亚马逊、微软)不得为中国AI模型提供算力,否则面临制裁;
3. 强化供应链防护,针对马来西亚、泰国等芯片中转风险国出台防范指南。

英伟达成最大赢家

废止旧规后,英伟达等美国企业解绑受限。5月14日,其向沙特Humain公司出口1.8万块AI GPU用于建设阿拉伯语超大规模语言模型;同时,阿联酋G42预计采购超100万块H100芯片。受此拉动,英伟达市值重返3万亿美元,黄仁勋净资产跃升至1200亿美元。

科技博弈转向双边合作竞争

特朗普政府以双边协议替代拜登时期全球统一框架,通过投资承诺与贸易合作向盟友(如阿联酋、沙特)放宽芯片供应。此举被认为既能孤立中国企业,又能巩固美国AI技术领导地位。

OpenAI首席科学家Nature:AI自主发现新科学!世界模型和RL是关键

原文链接:
OpenAI首席科学家Nature:AI自主发现新科学!世界模型和RL是关键

OpenAI首席科学家Jakub Pachocki:AI推理与强化学习重塑科研与经济

推理模型主导AI发展:最新顶尖模型如o3、Gemini 2.5 Pro和DeepSeek-R1均采用推理能力,通过思维链(CoT)解决复杂任务,已成为AI领域主流技术。

强化学习推动自主性突破:Pachocki强调,结合预训练和人类反馈的强化学习,使模型不仅能提取知识,还能形成独立思考逻辑,挑战现行分阶段训练模式。

AI具备科学发现潜力:尽管运行方式与人类不同,Pachocki认为AI已能通过推理发现新科学理论,并将在未来5年内重塑科研范式,最终实现自主编写高价值软件的里程碑。

开源模型的争议与责任:OpenAI计划推出可下载微调的开源模型,但安全风险限制了前沿模型权重的直接开放,需优先权衡技术影响力。

AGI的定义与经济指标:Pachocki将AGI的关键标志设定为“可量化的经济重塑能力”。微软和OpenAI已采用1000亿美元投资回报目标评估AGI进展,预计5年内科研与创新格局将被颠覆。

迪士尼与Epic合作通过AI复活詹姆斯·厄尔·琼斯经典声音

原文链接:
Forget the Force, AI brings the late James Earl Jones’ iconic Darth Vader voice
to Fortnite
by:John-Anthony Disotto

迪士尼与Epic合作通过AI复活詹姆斯·厄尔·琼斯经典声音

AI技术重现传奇角色声线:詹姆斯·厄尔·琼斯(享年93岁)为《星球大战》达斯·维达和《狮子王》木法沙配音的经典声音,经其遗产管理方授权后,由Google的Gemini 2.0 Flash模型与ElevenLabs Flash v2.5模型合作重建。

游戏互动新体验:该AI生成的声音将用于《堡垒之夜》,玩家可在游戏中与维达对话并招募其实力,但需年满13岁以启动AI对话功能。

伦理争议与授权审查:尽管琼斯曾以Respeecher技术在《曼达洛人》等影视项目中复现声音,但用AI延续逝者形象仍引发持续争议;此次合作强调以透明度、许可合规及安全性为核心开发原则。

Manus AI整合图像生成功能,引领智能助手新趋势

原文链接:
I tried Manus AI’s impressive new image generation and ChatGPT should watch out
by:Eric Hal Schwartz

Manus AI整合图像生成功能,引领智能助手新趋势

全功能AI代理定位 Manus AI作为一款来自中国的自主在线协作伙伴,通过“隐形鼠标与键盘”技术实现任务自动化,具备将复杂请求拆解并跨平台执行的能力。

差异化图像生成优势 核心竞争力在于将图像生成嵌入整体工作流,与Midjourney、Firefly等专注单一创作的工具不同,Manus生成的图像始终服务于具体商业目标(如食物车品牌设计)。

跨工具整合实操表现 实测显示其不仅能根据用户需求自动生成食物车形象、菜单、服饰等要素,还能结合自定义素材(如上传头像)完成场景化渲染,真正实现创意与任务的模块化联动。

发展前瞻性与现存挑战 虽然目前存在局部细节瑕疵(如人物形态真实性)和生成速度较慢等问题,但其构建的“目标导向型”AI模式预示未来AI将更注重跨模型协同而非单纯性能竞赛,为商业项目和虚构世界的构建提供更多可能性。

AI搜索的潜力与风险:以Google Overviews为例

原文链接:
Google’s AI Overviews are often so confidently wrong that I’ve lost all trust in
them
by:Max Delaney

AI搜索的潜力与风险:以Google Overviews为例

AI Overviews 技术本质是通过Google Gemini语言模型与RAG检索增强技术实现的智能搜索摘要系统。该功能在查询时生成钻石形状的标识,并自动将关键词转化为自然语言回答,理论上提升了搜索效率。

系统存在生成逻辑断层 问题:原始检索数据可能准确,但语言生成阶段会得出荒谬结论。典型案例包括推荐用胶水固定披萨芝士,以及将《星战》台词”如果你走,那就盛装前往”错误归因角色。

用户测试发现AI会对接收到的信息进行事实性扭曲,如将Lin-Manuel Miranda的幼子误认为兄弟。这类错误往往先引发自我怀疑,再导致传播性误导。

认知依赖危机 正在形成:现代社会依赖即时信息获取,但79%的幻觉率(测试中最高值)搭配”无验证式阅读”,可能削弱批判性思维能力。

SE Ranking研究显示Google有意规避敏感领域回答,包括金融/政治/健康/法律 类话题。虽然系统已内置风险意识,但目前技术基础决定了其可信度边界。成功获取的星战正确引述(”At this rate? It’s a trap!”)与错误陈述并存的特质,凸显其技术成熟度的局限。

规避机制失效警示:人为干预策略(如添加脏话触发人工验证)正逐渐失效。而企业级AI平台Vectara高管指出:”无论付出多少努力,幻觉始终存在”,这揭示了当前AI技术的基础缺陷。

揭秘Google I/O:Gemini系列AI创新将如何重塑数字生活?

原文链接:
4 Gemini announcements I can’t wait to hear at Google I/O this year
by:Eric Hal Schwartz

揭秘Google I/O:Gemini系列AI创新将如何重塑数字生活?

Project Mariner革新AI交互方式
Google推出基于Gemini的自动化工具Mariner,采用拟人化操作实现网页表单填写、在线预约等任务,可无缝衔接Gemini Advanced与Chrome浏览器,大幅提升行政效率及日常事务处理速度。

Gemini持久记忆功能升级
新增自主记忆系统,持续保存用户偏好(如避免早间会议、偏好靠过道座位等),支持交互学习与自定义指令录入,同时提供隐私控制面板实现数据可编辑性。

视觉生成工具全面进化
Imagen 4强化超写实图像生成风格一致性,Veo 3实现视频跨片段视觉统一,二者将深度整合Gemini生态,降低创意内容生产门槛。

Gemini Gems社区生态启动
推出可定制的轻量级AI模型创建工具,并计划开放跨用户分享机制Gem市场,加速构建类GPT Store的创意工具体系,推动AI应用生态扩张。

DeepMind技术融合加速
AI代理Mariner、Veo等众多DeepMind研发成果将成为Gemini技术矩阵重要组件,体现Google将前沿AI研究转化为消费级产品的能力。

最新AI相关信息报告

一、行业动态

(一)企业融资与投资

  1. 软银-OpenAI“星际之门”项目融资遇阻:软银集团原计划在美国投资1000亿美元建设AI基础设施的“星际之门”项目,因特朗普政府的关税政策带来的经济风险,项目融资谈判陷入停滞。同时,OpenAI自身的动荡也为项目增添了不确定性,但部分建设仍在推进。此外,软银对OpenAI的投资可能缩减至200亿美元。
  2. 沙特AI基建合作:沙特阿拉伯主权财富基金PIF旗下AI领域企业HUMAIN宣布与英伟达、高通、亚马逊AWS、AMD、思科等美国科技巨头进行AI基础设施合作。与AMD未来5年将投资至高100亿美元部署500MW规模的AI算力;与高通计划在沙特开发和构建基于高通边缘和数据中心解决方案的尖端AI数据中心等。
  3. 国家发改委资金投向:国家发改委联合多地政府成立首期规模1000亿元的“中国人工智能创新发展母基金”,重点投向AI芯片、机器人、生物计算等领域。

(二)企业产品发布与合作

  1. 百度:文心一言最新模型X1 Turbo|4.5 Turbo上线;大模型方言发音人全面上线,有12款发音人、9种方言;OCR电子行驶证识别重磅上线,结构化识别正副页字段,月免费额2000次。此外,百度荣获两大AI项目“2025爱迪生奖”,萝卜快跑在无人车领域获最佳新产品奖金奖,“濒危物种AI守护官2.0”获可持续发展领域最佳新产品奖银奖。
  2. 火山引擎:在FORCE LINK AI创新巡展·上海站,发布豆包·视频生成模型Seedance 1 lite、豆包1.5·视觉深度思考模型,并升级豆包·音乐模型。
  3. 腾讯:混元宣布开源首个多模态统一CoT奖励模型,与上海AI Lab、复旦大学、上海创智学院联合提出全新研究工作UnifiedReward – Think,构建出首个具备长链式推理能力的统一多模态奖励模型。
  4. 昆仑万维:正式开源(17B+)Matrix – Game大模型,即Matrix – Zero世界模型中的可交互视频生成大模型,是工业界首个开源的10B+空间智能大模型,面向游戏世界建模。
  5. 小米:申请推理大模型MiMo商标,状态为等待实质审查。该模型专注于从预训练到后训练的全过程优化,旨在全面提升推理能力,小米在2025年4月30日将这一技术开源。
  6. 苹果:机器学习团队携手南京大学和香港科技大学,推出名为Matrix3D的3D AI模型,专注于从少数2D照片中重建真实世界的物体和场景,革新了摄影测量技术体系,为沉浸式技术带来实际应用潜力。
  7. 蚂蚁数科:旗下企业级AI产品全线出海,首次在海外市场展示全栈AI产品矩阵,主打的AI产品包括智能体开发平台Agentar、多端开发产品mPaaS以及安全科技产品ZOLOZ等。

(三)市场使用趋势

Poe发布2025年春季AI模型使用趋势报告显示,DeepSeek R1使用率从2月峰值7%降至4月底3%,下降超50%;OpenAI因GPT – 4o新增吉卜力风格等文生图功能实现使用率暴涨;快手Kling系列在文生视频领域迅速崛起,三周内占据21%份额。在不同领域具体情况如下:

  1. 文本领域:OpenAI的GPT – 4.1系列和谷歌的Gemini 2.5 Pro在现实世界的编程任务中表现优异,份额迅速增加,分别达到约10%和约5%;Anthropic的Claude系列份额下降约10%。
  2. 文生视频:快手Kling家族视频生成模型获得约30%的使用份额,Kling – 2.0 – Master三周后产生21%的份额;谷歌的Veo 2保持约20%的使用份额;Runway使用份额下降约40%,降至约20%。
  3. 推理模型:发送给Poe推理模型的所有文本消息份额从约2%增加到约10%。Gemini 2.5 Pro使用迅速增长,获得约30%的推理消息份额;OpenAI的推理模型中,订阅者迅速采用最新模型;xAI的Grok 3在推理模型使用中占比不足1%;混合推理模型共同使用约为1%。
  4. 文生图像:GPT图像生成(GPT – Image – 1)两周内达到17%的图像生成使用率;谷歌的Imagen 3家族使用增长稳定,从约10%增加到约30%;黑森林实验室的FLUX家族图像生成模型占有率约为35%,份额轻微下降。
  5. 音频领域:用户偏爱ElevenLabs,满足约80%的所有订阅者的TTS请求;Cartesia、Unreal Speech、PlayAI和Orpheus等新兴竞争对手竞争加剧,市场开始多样化。

二、技术突破

(一)模型技术

  1. 中国科学院Difface模型:研究人员开发出Difface新型AI模型,可通过分析少量DNA片段重建一个人的面部。基于近10000名志愿者的数据训练,学习DNA中影响面部特征的SNP片段,建立遗传标记与面部结构联系,借助“扩散”技术生成人脸图像。仅凭DNA输入,重建面部平均误差约为3.5毫米,加上年龄、性别和BMI等信息,误差可缩小到3毫米以下。目前仅适用于汉族人群。
  2. 苹果Matrix3D模型:苹果机器学习团队联合高校推出的Matrix3D 3D AI模型,能从少数2D照片中重建真实世界的物体和场景。革新摄影测量技术体系,一次性整合图像、相机参数和深度数据等过程,减少中间环节,降低人为错误风险,提高整体性能。采用掩码学习方法训练,强化适应性,小数据集或不完整数据也能有效学习关键特征。
  3. AI在基因调控中的应用:国际科研团队利用深度学习算法,结合数千次血液细胞分化实验数据,设计出具有精准调控功能的合成增强子。可预测特定细胞类型中所需的增强子序列,设计出在目标细胞中特异性激活或抑制目标基因的合成增强子,为基因治疗和细胞工程提供技术支撑。预计到2027年,全球基因调控工具市场规模将突破20亿美元,AI技术将扮演核心角色。

(二)其他技术

  1. 美国威瑞森:生物科技公司Verseon在2025年IEEE人工智能大会上发表两项创新成果。首项技术通过新型插补方法使生物年龄预测误差降低22%;第二项AutoESSV技术改进了AI模型集成策略,在16个测试数据集上实现回归误差减少25%、分类误差降低12%,适用于医疗等数据不完善领域。
  2. AI万物迁移技术:2025年该技术掀起视觉领域变革风暴,主流工具如ComfyUI工作流(结合Flux套件)、StartAI(Photoshop插件)、在线工具、DrawThings(Mac专用)等,可实现图像、视频中的物体智能替换与融合,适用于电商、建筑设计、影视制作等多个行业。

三、应用案例

(一)天文研究**

  1. AstroAgents系统:美国国家航空航天局(NASA)戈达德太空飞行中心开发的“AstroAgents”系统,由8个“AI代理”组成,可在天体生物学领域自主进行研究,分析数据并生成科学假设,涵盖从阅读文献到撰写论文的全流程。开发者计划用该系统研究NASA将从火星带回的样本,以确定其中是否含有表明过去或现在生命存在的有机分子。
  2. 机器学习识别系外行星:NASA机器学习科学家与天文学家携手开展自动化项目,构建的机器学习程序ExoMiner识别出370颗此前未知的系外行星。
  3. SETI助力监测宇宙电磁信号:美国加州大学伯克利分校的搜寻地外文明(SETI)计划研究中心为甚大天线阵列(VLA)构建AI驱动的软件系统,每秒能处理2太字节(TB)数据,增加了新的搜寻目标。SETI还参与“突破聆听”计划,广泛扫描百万颗恒星和百个星系,寻找生命存在的证据。此外,AI也被用于探测地球附近更温和的生命迹象。

(二)医疗领域**

  1. Kimi布局AI + 医疗:月之暗面旗下产品Kimi近期对AI医疗产品进行布局,优化财经、法律、医学等专业领域的搜索信源质量,探索Agent等产品方向。
  2. 中山大学成果:中山眼科中心与华为合作研发首款眼科大模型ChatZOC,提升服务效率75%;运营管理的国家超级计算广州中心,将超算智算融合,赋能产业创新,以生物医药产业为例,药物设计及动物实验验证时间从2年缩短至49天。

(三)农业领域**

中山大学地理科学与规划学院教授石茜带领飞鸟团队试点“AI + 无人机”的智慧种植模式,通过遥感技术、无人机低空飞巡、AI识别作物长势等进行农情预警,再由大数据来指导种植,实现对果园的数字化管理。试点后的果园荔枝产量平均增长了20%,品质也有明显提升,今年该果园“AI智慧管家”被广东省农业农村厅列为新技术新模式,在全省的荔枝主产区推广。

四、发展趋势与挑战

(一)发展趋势

  1. 技术趋势
    • 智能体崛起:以OpenAI o1/o3、微软Copilot为代表的Agentic AI正推动AI从“辅助工具”升级为“超级助理”,能解析复杂指令,在医疗诊断、代码开发等领域提升效率。预计到2028年,AI将自动化15%的日常决策。
    • 小模型与合成数据崛起:微软Orca 2、DeepSeek R1等小模型通过优化算力效率,在端侧设备上实现媲美大模型的性能,为工业质检、金融风控等场景的本地化部署铺平道路。
    • 生成式搜索发展:AI促使信息检索从传统的关键字搜索转变为生成答案的新模式,提升信息获取效率,但也带来原创内容版权保护、AI生成内容可信度等问题。
    • 基础设施与主权AI投入增加:全球科技巨头持续加大对AI基础设施建设的投入,如微软投资800亿美元;各国推进“主权AI”战略,强化数据本地化与合规审查。
  2. 应用趋势
    • “产业 + AI”模式推广:企业积极拥抱AI变革,“AI in All”模式下AI融入企业产品、服务和业务流程;“All in AI”模式从研发到客户体验全流程重塑,打造“AI原生”企业。
    • 自动驾驶与Robotaxi商业化:自动驾驶技术迈向端到端模式,Robotaxi逐渐进入商业化落地阶段。
    • AI4science发展:AI在科学研究领域发挥重要作用,如药物研发、材料科学、气候变化模拟等,开启AI4science的黄金时代。

(二)面临挑战

  1. 伦理与隐私问题:AI的快速发展引发算法偏见、数据滥用、个人隐私泄露以及“黑箱”问题等伦理和隐私担忧,需要制定明确的伦理准则,加强监管和技术手段保障数据安全。
  2. 就业与社会结构调整:AI技术的广泛应用可能导致大量传统岗位消失,加剧就业市场的技能不匹配问题,同时可能加剧社会结构不平等,政府和企业需提供再培训和职业转型支持。
  3. 安全与控制风险:AI技术带来新的安全威胁,如网络攻击、数据泄露等,甚至可能被用于军事和监视领域威胁个人自由和国际安全,需要加强国际合作,制定安全标准和规范。
  4. 法律与监管空白:现有的法律框架和监管机制难以适应AI技术的深入应用,如何界定AI系统的法律责任、保护数据安全和隐私以及规范AI在敏感领域的应用成为亟待解决的问题。

奥特曼妥协了!OpenAI公布重大公司调整,放弃成为营利性公司

原文链接:
奥特曼妥协了!OpenAI公布重大公司调整,放弃成为营利性公司

OpenAI结构改革:回归非营利初心,微软成关键阻碍

OpenAI宣布重大结构转型,放弃营利性公司架构,回归非营利组织控制模式。营利性子公司将转变为公益性公司(PBC),非营利董事会继续掌握核心控制权,并成为PBC主要股东。

Sam Altman重申AGI普惠愿景,提出打造「全球大脑」目标,强调AGI应服务全人类而非少数群体。他指出未来需投入数千亿至万亿美元级资金,并承诺推动AI民主化,允许用户自由使用工具创造价值。

微软态度成关键变量,作为已投资137.5亿美元的最大股东,微软尚未对重组方案表态。其特殊地位源于与OpenAI的授权协议和收入分成关系,目前正就合同条款及股权问题进行关键性谈判。

组织架构调整细节披露:非营利组织将主导AGI安全对齐研究,PBC架构允许投资者和员工持有无上限增值股权。软银集团已承诺300亿美元新融资,但重组方案仍需非营利委员会及微软最终批准。

超越DeepSeek-R1英伟达开源新王登顶!14万H100小时训练细节曝光

原文链接:
超越DeepSeek-R1英伟达开源新王登顶!14万H100小时训练细节曝光

英伟达Llama-Nemotron系列模型:开源新王超越DeepSeek-R1

模型突破性成就:英伟达推出Llama-Nemotron系列模型(LN-Nano 8B、LN-Super 49B、LN-Ultra 253B),在推理吞吐量、内存效率及性能上全面超越DeepSeek-R1,且全部开源。其中LN-Ultra可在单个8xH100节点运行,成为当前最智能的开源模型。

创新架构设计:采用Puzzle神经架构搜索框架,通过逐块局部蒸馏FFN融合技术优化推理效率。Puzzle框架利用混合整数规划实现模块化配置,在计算成本与模型准确性间取得最佳平衡,显著降低跨GPU通信开销。

五阶段训练流程:包含神经架构搜索、知识蒸馏、监督微调(SFT)、强化学习(RL)及对齐训练。其中强化学习阶段通过FP8精度生成和课程训练策略,使LN-Ultra在GPQA-D基准测试中超越教师模型DeepSeek-R1。

推理开关功能:全球首创通过系统提示词「detailed thinking on/off」动态切换推理模式,无需更换模型即可实现日常对话与复杂多步骤推理的统一。

性能评估亮点:LN-Ultra在GPQA-Diamond准确率与吞吐量对比中全面领先,且在Arena Hard测试中得分88.3,超越Claude 3.5 Sonnet和GPT-4o等专有模型。LN-Nano虽参数量小,但在AIME、MATH500等推理基准测试中表现优异。

豪掷30亿美元,OpenAI史上最大收购案!

原文链接:
豪掷30亿美元,OpenAI史上最大收购案!

OpenAI 30亿美元收购Windsurf:AI编程市场格局重塑

30亿美元创纪录收购:OpenAI即将完成对AI编程工具Windsurf(前身为Codeium)的收购,交易金额高达30亿美元,成为其史上最大规模收购案。

技术优势凸显竞争力:Windsurf以模型无关性设计著称,支持开发者自由选择LLM(如Llama 3.1、GPT-4o等),并具备动态重构、低延迟推理及模块化微调等核心技术。

估值三年翻24倍:从2021年成立到2024年B轮融资估值5亿美元,再到近期30亿美元收购价,Windsurf估值实现指数级增长,反映市场对其技术前景的高度认可。

战略布局应对竞争:此举旨在对抗Claude系列、Gemini 2.5 Pro等竞品,同时弥补OpenAI在开发者界面和实时协作领域的短板,实现全栈技术控制。

行业生态深度整合:通过Windsurf的80万开发者用户和1000家企业的客户基础,OpenAI将加速渗透企业级代码库管理及大规模协作场景,与GitHub Copilot形成互补。

资本驱动市场变革:依托软银领投的400亿美元融资(3000亿美元估值),OpenAI以收购方式强化AI编程领域主导地位,可能引发行业新一轮整合浪潮。