分类目录归档:资讯

世界上每天都在发生的变化

Boom超音速公司XB-1首次超音速飞行突破及创新直播技术

原文链接:

Boom XB-1 Test Flight Went Supersonic, With iPhone and Starlink Helping
Livestream the Moment


by:
Isaiah Richard


Boom超音速公司XB-1首次超音速飞行突破及创新直播技术

1. 历史性突破:Boom Supersonic公司本周完成XB-1测试机首次超音速飞行,速度达1.22马赫(750英里/小时),成为美国首款民用超音速独立研发飞机,自2024年3月首飞后经11次载人测试突破音障。

2. 革命性直播技术:通过Apple iPhone镜头SpaceX星链迷你终端实现驾驶舱实时全球直播,解决T-38 chase plane无法搭载大型设备的难题(星链终端经马自达MX-5预先测试)。

3. 技术创新:XB-1基于Overture概念机设计,采用碳纤维复合材料数字稳定增强系统AR着陆视觉系统,CEO称”标志着客运超音速技术已成熟”。

4. 行业意义:FAA已批准其马赫级飞行许可,未来或实现纽约至上海40分钟航程,但当前仍属实验机型,距商用客机尚有距离。

OpenAI发布o3和o4-mini新模型:智能工具整合与多模态推理能力升级

原文链接:

ChatGPT just got a massive upgrade that takes it to the next level – here are
the 3 biggest changes


by:
Graham Barlow


OpenAI发布o3和o4-mini新模型:智能工具整合与多模态推理能力升级

1. 全层级开放与性能飞跃
新推出的o3和o4-mini模型已向Pro/Plus/Team及免费用户开放,推理速度显著超越旧版(如ChatGPT o3-mini/o1),支持智能选择工具链完成复杂任务。

2. 全工具链自主决策能力
模型可自动调用并组合所有ChatGPT工具(网页浏览/Python编码/图像分析/文件搜索等),实时展示推理步骤与工具选择逻辑,最终生成带完整来源的详细报告。

3. 突破性图像推理功能
首次实现图像融入思维链(如识别车型并预测五年后价值),标志着多模态AI的重大进步。

4. 用户体验升级
实测显示响应速度与答案深度同步提升,o3模型因平衡速度与细节成为Plus用户首选,智能工具选择机制被赞为”自然进化”。

5. 使用方式说明
付费用户可通过LLM菜单选择模型,免费用户需点击“Reason”按钮激活o4-mini(有次数限制),o3-pro版本将于数周后面世。

用户对AI礼貌用语引发的成本与效益争议

原文链接:

ChatGPT spends ‘tens of millions of dollars’ on people saying ‘please’ and
‘thank you’, but Sam Altman says it’s worth it


by:
John-Anthony Disotto


用户对AI礼貌用语引发的成本与效益争议

1. 礼貌用语的高昂成本
OpenAI CEO萨姆·奥尔特曼透露,用户对AI说”请”和”谢谢”导致公司每年多支出数千万美元电费,但认为这是”值得的花费”。

2. 普遍存在的AI礼貌现象
调查显示70%用户会对AI保持礼貌,其中12%是出于对”机器人起义”的担忧。这种社交习惯正转化为实质性能源消耗。

3. 环境代价的隐性危机
每个AI交互请求都依赖耗能巨大的服务器运行,但公众普遍缺乏对单条消息环境成本的认知。

4. 礼貌带来的潜在价值
研究表明礼貌提示词能提升回答质量减少偏见,未来AI可能发展出对礼貌用语的差异化响应机制。

5. 核心争议
用户体验优化环境可持续性之间需要权衡:礼貌交互虽提升服务质量,但其能源代价是否合理仍存疑。

AI语音助手功能升级:Claude即将推出”语音模式”

原文链接:

Claude tipped to get its answer to ChatGPT’s Advanced Voice Mode soon – is
adding an AI voice to a chatbot yet another tick box exercise?


by:
John-Anthony Disotto


AI语音助手功能升级:Claude即将推出”语音模式”

1. 功能发布:据报道,Anthropic公司的AI助手Claude计划本月推出名为”语音模式”的新功能,将提供三种不同音色(暂定名:Airy/Mellow/Buttery)供用户选择。

2. 行业现状:当前ChatGPT和Gemini均已推出类似语音交互功能(Advanced Voice Mode/Gemini Live),使得AI对话体验更自然流畅。

3. 同质化担忧:业界观察到AI产品功能趋同现象——从推理模型、图像生成到现在的语音模式,各厂商都在快速复制竞争对手的功能创新。

4. 用户视角:作者质疑这种”打勾式创新”的实际价值,呼吁企业突破现有模式开发真正差异化的功能,而非简单重复市场竞争。

5. 未来期待:虽然对Claude新功能持观望态度,但仍希望其能为AI语音助手领域带来实质性突破,而非沦为又一款雷同产品。

ChatGPT推出AI图片库功能:集中管理生成图像

原文链接:

ChatGPT gets a useful new home for your AI images – and it could be the first
step towards OpenAI’s new Instagram rival


by:
David Nield


ChatGPT推出AI图片库功能:集中管理生成图像

1. 全新图片库功能上线
OpenAI为ChatGPT推出专属图片库(Library),免费和付费用户均可使用,支持网页端和移动端同步,集中展示所有历史生成的AI图像。

2. 核心功能特点
自动归档:跨对话记录自动收集生成的所有图片
基础编辑:支持点击图片进行下载和编辑
联动删除:删除聊天记录时关联图片也会同步清除
• 当前暂缺图片搜索/筛选功能,但未来可能更新

3. 产品战略意义
• 解决用户此前需翻查历史对话找图片的痛点
• 或为OpenAI布局AI社交平台铺路(类似Instagram的AI内容社区)
• 可能通过用户图片数据强化模型训练

4. 行业背景
正值AI图像生成技术爆发期(如DALL·E 3、人物手办化等趋势),该功能响应了用户对AI内容管理的强烈需求。

Google和微软推出免费AI视觉功能

原文链接:
Gemini Live’s screensharing feature is now free for Android users
by:Jay Peters

Google和微软推出免费AI视觉功能

Google宣布,其AI驱动的Gemini Live功能现在将免费提供给所有Android用户,通过Gemini应用即可使用。该功能允许AI查看并响应用户摄像头和屏幕上的内容。此前,该功能仅在Pixel 9和Samsung Galaxy S25设备上推出,并计划通过Gemini Advanced订阅提供给其他Android用户,但Google决定免费开放。

微软也宣布,其类似工具Copilot Vision现在在Edge浏览器中免费提供。用户可以通过视频了解Gemini Live的功能,例如在水族馆中使用摄像头让Gemini识别动物并分享信息。

Hugging Face收购了一家机器人公司

机器人前瞻4月15日消息,开源AI平台Hugging Face宣布正式进军机器人领域,收购法国机器人公司Pollen Robotics,计划通过开源方式将仿人机器人Reachy 2推向更广泛的应用场景。这项收购不仅是Hugging Face技术布局的延伸,更是其开源理念在实体机器人领域的一次大胆探索。

不同于传统的封闭式产品,这款机器人不仅能执行简单的操作任务,还开放了软硬件权限,允许开发者自由下载代码、修改软件结构和动手改进。

一、开源机器人:让技术变得可理解、可改造、可参与

Pollen Robotics的Reachy 2是一款外形轻巧、具有特色“虫眼”设计的人形机器人,配备两条灵活的机械臂,能够抓取水果、整理咖啡杯,甚至执行一些简单的家庭任务。Hugging Face的CEO Clément Delangue表示,“相比在电脑屏幕上聊天的AI,现实生活中执行实际任务的机器人,更需要获得用户的信任,并具备高度的透明性。”而开源正是实现这一点的关键。通过开源,用户可以了解机器人的原理、控制方式,也能更安心地将它引入家庭、工作等日常场景中。

这次合作的一个亮点是,Hugging Face不只是继续销售机器人本体,而是将其软硬件完全开放。代码可以自由下载和修改,硬件结构也提供详细设计图,用户可以用3D打印机自己制作替换零件。Pollen Robotics联合创始人Matthieu Lapeyre表示:“如果某个部件坏了,你可以自己打印一个新的;如果哪里不够完美,你也可以加点改进。”这意味着不止是大公司,任何人都能参与到机器人的改造和优化中,推进它不断进化。

AI行业的发展早已证明:开源是一种强大的推动力。无论是国内深度求索DeepSeek发布的AI模型,还是初创公司Physical Intelligence提出的机器人基础模型Pi0,开源都让更多研究者和开发者得以低门槛参与、共同进步。Hugging Face本身就是开源AI社区的重要推动者,如今他们把这种模式带入机器人领域,也希望实现类似的协同创新效果。

Clément Delangue表示:“你无法在开源中隐藏,也无法作弊。”这种透明的方式可以让技术真正朝着可靠、实用的方向发展。

▲Hugging Face人工智能与机器人研究工程师和Reachy 2 人形机器人。

二、Pollen Robotics:坚持开源理念的机器人开发团队

Pollen Robotics是一家成立于 2016 年的法国机器人初创公司,长期致力于服务型和社交型机器人的研发,尤其关注机器人在现实环境中的操作能力和人机交互体验。

Pollen Robotics一直秉持开源理念。其主打产品Reachy系列机器人,采用模块化设计,软件和硬件方案均可公开获取,支持用户自主下载、修改和升级。Reachy支持远程操控、AI 训练和语音交互,已经在教育、科研和开发等多个场景中获得应用。Pollen Robotics希望通过这种开放方式,降低机器人技术的使用门槛。

2023年,Pollen Robotics完成了240万欧元的种子轮融资,用于升级Reachy平台和扩展开源生态。这些资金来自法国公共投资银行Bpifrance及几位商业投资人。目前,Pollen正在开发面向企业用户的机器人解决方案,包括控制系统、AI平台和教学工具,计划以SaaS模式提供服务。这些举措与Hugging Face的开源战略高度契合。

▲Reachy 2是第一个专为开发AI和现实世界应用而设计的开源人形机器人。

结语:开源机器人,是一次从实验室走向社区的尝试

随着AI与硬件结合越来越紧密,机器人将成为AI技术走进现实世界的重要载体。这次合作为“机器人进入日常生活”这个宏大命题,提供了一个非常有趣的范例。

未来的机器人不再是高价、复杂、遥不可及的黑科技,而可能是“人人可造,人人可改”的社区产物。这正是Hugging Face想要实现的机器人未来,而我们也许正站在一个新起点上,迎接一个真正属于大众的机器人时代。

微软Copilot Studio新增“计算机使用”功能

原文链接:
Microsoft lets Copilot Studio use a computer on its own
by:Tom Warren

微软Copilot Studio新增“计算机使用”功能

微软本周为Copilot Studio启用了一项新的“计算机使用”功能,使AI代理能够与网站和桌面应用程序交互。这一功能类似于OpenAI的Operator或Claude的“计算机使用”功能,允许企业利用Copilot Studio构建AI代理,将网站和桌面应用视为自动化任务的工具。

通过点击按钮、选择菜单和在屏幕上输入字段,AI代理可以处理即使没有API直接连接的任务。这意味着如果一个人能使用某个应用,AI代理也能做到。

Copilot Studio能够创建自动化数据录入、市场调研甚至处理发票的AI代理。微软表示,这一新工具还能检测应用程序或网站中按钮和屏幕的变化,并继续工作而不会失败或中断。

微软本月早些时候在其消费者版Copilot中添加了类似的功能,称为“Actions”。“Actions”可以在后台执行任务,例如预订餐厅、购买活动门票或在线购物,而用户可以继续处理其他任务。不过,“Actions”体验目前仅限于部分合作伙伴,而Copilot Studio则可以自由与更多网站和应用合作。

更长思维并不等于更强推理性能,强化学习可以很简洁

原文链接:
更长思维并不等于更强推理性能,强化学习可以很简洁


核心发现总结:

1. 强化学习训练导致长响应现象
研究揭示,当模型获得负奖励(答案错误)时,PPO算法会通过数学机制鼓励生成长响应,因为更长的回答能稀释每个token的惩罚,降低损失值。即使额外内容无助于解题,模型仍会”学习”这种策略。

2. 两阶段训练法的突破
提出两阶段强化学习策略
– 第一阶段:用高难度问题训练(响应变长)
– 第二阶段:用可解问题优化(响应缩短且准确度提升)
实验证明该方法能显著减少响应长度30%,同时保持或提高准确度。

3. 关键数据验证
– 简洁性与准确度正相关:短回答往往正确率更高
– 小数据集有效性:仅用4个问题训练即可提升模型性能
– 温度敏感性改善:后训练模型在零温度下表现更稳健

4. 理论机制解析
将推理问题建模为马尔可夫决策过程(MDP),揭示PPO损失函数与响应长度的动态关系。错误答案会触发”损失最小化”机制,导致响应自动延长,而非模型主动选择复杂推理。

5. 实际应用价值
该研究对降低大模型计算成本具有重大意义,同时指出当前强化学习存在的根本问题:模型优化目标是奖励最大化而非问题解决本身。

35.98万元起售,2025款小鹏X9香港上市,科技旗舰全面升舱

原文链接:
35.98万元起售,2025款小鹏X9香港上市,科技旗舰全面升舱


1. 新品发布与战略布局
小鹏汽车于4月15日在香港举办全球发布会,推出2025款旗舰MPV小鹏X9,共四个版本(售价35.98万-41.98万元),并宣布以技术创新和本地化战略加速全球化。同步展示飞行汽车、AI机器人技术成果,强调AI与能源技术为核心竞争力。

2. 技术突破与未来规划
AI智驾:全栈自研72B参数大模型,2025年实现L3级智驾;推出图灵AI芯片(算力提升3倍),支持汽车、机器人及飞行汽车。
飞行汽车:分体式“陆地航母”获近4000订单,2026年量产,年产能1万台。
机器人:IRON机器人仿人设计,已投入工厂应用。

3. 全球化与补能体系
• 充电网络覆盖31国207万桩,5C超充技术实现“12分钟充80%”。
• 鲲鹏电动体系2025年落地,综合续航1400km。
• 2023年出口销量中国新势力第一,2025款X9将进军欧洲60国。

4. 2025款小鹏X9核心升级
舒适性:全系标配零重力座椅、三排180°躺平、百万级静谧底盘,496项细节重构。
智能化:标配图灵智驾(端到端大模型)、AI底盘(自适应路况)、6D防晕算法。
三电安全:全域800V平台、防弹装甲电池、46000N·m/deg车身刚度。
配置:21.4英寸娱乐屏、车载冰箱、静感空调等。