应用材料公司高级机械工程师Deepak Srikantaiah的技术贡献与职业成就

原文链接:

Inside Deepak Doddabelavangala Srikantaiah’s Engineering Expertise: Powering
Semiconductor Progress


by:
Carl Williams


应用材料公司高级机械工程师Deepak Srikantaiah的技术贡献与职业成就

1. 核心职责与专利成果
作为应用材料公司资深机械工程师,Deepak Srikantaiah专注半导体制造设备的污染控制与原子级精度系统设计,其研发的多面板处理室专利技术(US 10,811,232 B2)有效解决了金属污染问题并提升镀层附着力。

2. 纳米级制造技术专长
通过热管理、精密机械与运动控制系统的整合创新,开发出能承受极端温度的特种陶瓷涂层,并设计洁净室兼容的维护接入系统,确保两米处理腔体的温度稳定性。

3. 全流程工程能力
运用CAD建模/FEA结构分析/CFD流体仿真等工具链,主导从概念设计到量产落地的完整流程,通过Teamcenter平台实现全球供应链协同与组件规格管理。

4. 跨领域技术领导力
作为高级技术专家,制定工程标准、审核技术文献,并指导离岸团队。在GD&T几何公差、材料选择和热力学应用方面建立行业基准解决方案

5. 职业发展轨迹
从Kennametal Widia的专用机床设计起步,经博世集团跨国项目历练,到2014年正式加入应用材料公司,逐步形成“精密工程方法论”体系,持续推动半导体制造设备的产能提升与成本优化

用户对AI礼貌用语引发的成本与效益争议

原文链接:

ChatGPT spends ‘tens of millions of dollars’ on people saying ‘please’ and
‘thank you’, but Sam Altman says it’s worth it


by:
John-Anthony Disotto


用户对AI礼貌用语引发的成本与效益争议

1. 礼貌用语的高昂成本
OpenAI CEO萨姆·奥尔特曼透露,用户对AI说”请”和”谢谢”导致公司每年多支出数千万美元电费,但认为这是”值得的花费”。

2. 普遍存在的AI礼貌现象
调查显示70%用户会对AI保持礼貌,其中12%是出于对”机器人起义”的担忧。这种社交习惯正转化为实质性能源消耗。

3. 环境代价的隐性危机
每个AI交互请求都依赖耗能巨大的服务器运行,但公众普遍缺乏对单条消息环境成本的认知。

4. 礼貌带来的潜在价值
研究表明礼貌提示词能提升回答质量减少偏见,未来AI可能发展出对礼貌用语的差异化响应机制。

5. 核心争议
用户体验优化环境可持续性之间需要权衡:礼貌交互虽提升服务质量,但其能源代价是否合理仍存疑。

OpenAI发布o3和o4-mini新模型:智能工具整合与多模态推理能力升级

原文链接:

ChatGPT just got a massive upgrade that takes it to the next level – here are
the 3 biggest changes


by:
Graham Barlow


OpenAI发布o3和o4-mini新模型:智能工具整合与多模态推理能力升级

1. 全层级开放与性能飞跃
新推出的o3和o4-mini模型已向Pro/Plus/Team及免费用户开放,推理速度显著超越旧版(如ChatGPT o3-mini/o1),支持智能选择工具链完成复杂任务。

2. 全工具链自主决策能力
模型可自动调用并组合所有ChatGPT工具(网页浏览/Python编码/图像分析/文件搜索等),实时展示推理步骤与工具选择逻辑,最终生成带完整来源的详细报告。

3. 突破性图像推理功能
首次实现图像融入思维链(如识别车型并预测五年后价值),标志着多模态AI的重大进步。

4. 用户体验升级
实测显示响应速度与答案深度同步提升,o3模型因平衡速度与细节成为Plus用户首选,智能工具选择机制被赞为”自然进化”。

5. 使用方式说明
付费用户可通过LLM菜单选择模型,免费用户需点击“Reason”按钮激活o4-mini(有次数限制),o3-pro版本将于数周后面世。

ChatGPT推出AI图片库功能:集中管理生成图像

原文链接:

ChatGPT gets a useful new home for your AI images – and it could be the first
step towards OpenAI’s new Instagram rival


by:
David Nield


ChatGPT推出AI图片库功能:集中管理生成图像

1. 全新图片库功能上线
OpenAI为ChatGPT推出专属图片库(Library),免费和付费用户均可使用,支持网页端和移动端同步,集中展示所有历史生成的AI图像。

2. 核心功能特点
自动归档:跨对话记录自动收集生成的所有图片
基础编辑:支持点击图片进行下载和编辑
联动删除:删除聊天记录时关联图片也会同步清除
• 当前暂缺图片搜索/筛选功能,但未来可能更新

3. 产品战略意义
• 解决用户此前需翻查历史对话找图片的痛点
• 或为OpenAI布局AI社交平台铺路(类似Instagram的AI内容社区)
• 可能通过用户图片数据强化模型训练

4. 行业背景
正值AI图像生成技术爆发期(如DALL·E 3、人物手办化等趋势),该功能响应了用户对AI内容管理的强烈需求。

AI语音助手功能升级:Claude即将推出”语音模式”

原文链接:

Claude tipped to get its answer to ChatGPT’s Advanced Voice Mode soon – is
adding an AI voice to a chatbot yet another tick box exercise?


by:
John-Anthony Disotto


AI语音助手功能升级:Claude即将推出”语音模式”

1. 功能发布:据报道,Anthropic公司的AI助手Claude计划本月推出名为”语音模式”的新功能,将提供三种不同音色(暂定名:Airy/Mellow/Buttery)供用户选择。

2. 行业现状:当前ChatGPT和Gemini均已推出类似语音交互功能(Advanced Voice Mode/Gemini Live),使得AI对话体验更自然流畅。

3. 同质化担忧:业界观察到AI产品功能趋同现象——从推理模型、图像生成到现在的语音模式,各厂商都在快速复制竞争对手的功能创新。

4. 用户视角:作者质疑这种”打勾式创新”的实际价值,呼吁企业突破现有模式开发真正差异化的功能,而非简单重复市场竞争。

5. 未来期待:虽然对Claude新功能持观望态度,但仍希望其能为AI语音助手领域带来实质性突破,而非沦为又一款雷同产品。

Google和微软推出免费AI视觉功能

原文链接:
Gemini Live’s screensharing feature is now free for Android users
by:Jay Peters

Google和微软推出免费AI视觉功能

Google宣布,其AI驱动的Gemini Live功能现在将免费提供给所有Android用户,通过Gemini应用即可使用。该功能允许AI查看并响应用户摄像头和屏幕上的内容。此前,该功能仅在Pixel 9和Samsung Galaxy S25设备上推出,并计划通过Gemini Advanced订阅提供给其他Android用户,但Google决定免费开放。

微软也宣布,其类似工具Copilot Vision现在在Edge浏览器中免费提供。用户可以通过视频了解Gemini Live的功能,例如在水族馆中使用摄像头让Gemini识别动物并分享信息。

Hugging Face收购了一家机器人公司

机器人前瞻4月15日消息,开源AI平台Hugging Face宣布正式进军机器人领域,收购法国机器人公司Pollen Robotics,计划通过开源方式将仿人机器人Reachy 2推向更广泛的应用场景。这项收购不仅是Hugging Face技术布局的延伸,更是其开源理念在实体机器人领域的一次大胆探索。

不同于传统的封闭式产品,这款机器人不仅能执行简单的操作任务,还开放了软硬件权限,允许开发者自由下载代码、修改软件结构和动手改进。

一、开源机器人:让技术变得可理解、可改造、可参与

Pollen Robotics的Reachy 2是一款外形轻巧、具有特色“虫眼”设计的人形机器人,配备两条灵活的机械臂,能够抓取水果、整理咖啡杯,甚至执行一些简单的家庭任务。Hugging Face的CEO Clément Delangue表示,“相比在电脑屏幕上聊天的AI,现实生活中执行实际任务的机器人,更需要获得用户的信任,并具备高度的透明性。”而开源正是实现这一点的关键。通过开源,用户可以了解机器人的原理、控制方式,也能更安心地将它引入家庭、工作等日常场景中。

这次合作的一个亮点是,Hugging Face不只是继续销售机器人本体,而是将其软硬件完全开放。代码可以自由下载和修改,硬件结构也提供详细设计图,用户可以用3D打印机自己制作替换零件。Pollen Robotics联合创始人Matthieu Lapeyre表示:“如果某个部件坏了,你可以自己打印一个新的;如果哪里不够完美,你也可以加点改进。”这意味着不止是大公司,任何人都能参与到机器人的改造和优化中,推进它不断进化。

AI行业的发展早已证明:开源是一种强大的推动力。无论是国内深度求索DeepSeek发布的AI模型,还是初创公司Physical Intelligence提出的机器人基础模型Pi0,开源都让更多研究者和开发者得以低门槛参与、共同进步。Hugging Face本身就是开源AI社区的重要推动者,如今他们把这种模式带入机器人领域,也希望实现类似的协同创新效果。

Clément Delangue表示:“你无法在开源中隐藏,也无法作弊。”这种透明的方式可以让技术真正朝着可靠、实用的方向发展。

▲Hugging Face人工智能与机器人研究工程师和Reachy 2 人形机器人。

二、Pollen Robotics:坚持开源理念的机器人开发团队

Pollen Robotics是一家成立于 2016 年的法国机器人初创公司,长期致力于服务型和社交型机器人的研发,尤其关注机器人在现实环境中的操作能力和人机交互体验。

Pollen Robotics一直秉持开源理念。其主打产品Reachy系列机器人,采用模块化设计,软件和硬件方案均可公开获取,支持用户自主下载、修改和升级。Reachy支持远程操控、AI 训练和语音交互,已经在教育、科研和开发等多个场景中获得应用。Pollen Robotics希望通过这种开放方式,降低机器人技术的使用门槛。

2023年,Pollen Robotics完成了240万欧元的种子轮融资,用于升级Reachy平台和扩展开源生态。这些资金来自法国公共投资银行Bpifrance及几位商业投资人。目前,Pollen正在开发面向企业用户的机器人解决方案,包括控制系统、AI平台和教学工具,计划以SaaS模式提供服务。这些举措与Hugging Face的开源战略高度契合。

▲Reachy 2是第一个专为开发AI和现实世界应用而设计的开源人形机器人。

结语:开源机器人,是一次从实验室走向社区的尝试

随着AI与硬件结合越来越紧密,机器人将成为AI技术走进现实世界的重要载体。这次合作为“机器人进入日常生活”这个宏大命题,提供了一个非常有趣的范例。

未来的机器人不再是高价、复杂、遥不可及的黑科技,而可能是“人人可造,人人可改”的社区产物。这正是Hugging Face想要实现的机器人未来,而我们也许正站在一个新起点上,迎接一个真正属于大众的机器人时代。

微软Copilot Studio新增“计算机使用”功能

原文链接:
Microsoft lets Copilot Studio use a computer on its own
by:Tom Warren

微软Copilot Studio新增“计算机使用”功能

微软本周为Copilot Studio启用了一项新的“计算机使用”功能,使AI代理能够与网站和桌面应用程序交互。这一功能类似于OpenAI的Operator或Claude的“计算机使用”功能,允许企业利用Copilot Studio构建AI代理,将网站和桌面应用视为自动化任务的工具。

通过点击按钮、选择菜单和在屏幕上输入字段,AI代理可以处理即使没有API直接连接的任务。这意味着如果一个人能使用某个应用,AI代理也能做到。

Copilot Studio能够创建自动化数据录入、市场调研甚至处理发票的AI代理。微软表示,这一新工具还能检测应用程序或网站中按钮和屏幕的变化,并继续工作而不会失败或中断。

微软本月早些时候在其消费者版Copilot中添加了类似的功能,称为“Actions”。“Actions”可以在后台执行任务,例如预订餐厅、购买活动门票或在线购物,而用户可以继续处理其他任务。不过,“Actions”体验目前仅限于部分合作伙伴,而Copilot Studio则可以自由与更多网站和应用合作。

xAI旗下Grok即将推出记忆功能等多项更新 向主流AI工具看齐

原文链接:

Grok may start remembering everything you ask it to do, according to new reports


by:
Eric Hal Schwartz


xAI旗下Grok即将推出记忆功能等多项更新 向主流AI工具看齐

1. 核心功能升级
Grok将新增”记忆系统”,通过设置中的“Personalise with Memories”开关实现。该功能允许AI引用历史对话内容,例如提醒用户”我们之前讨论过这个吗?”,标志着从即时工具向长期助手的转变。

2. 用户隐私控制
记忆系统采用用户完全可控的设计,支持删除特定记忆或全部数据,这与行业标准一致,对建立工作/生活场景中的信任至关重要。

3. 竞品对标加速
xAI以“冲刺速度”推进更新,试图快速追平ChatGPT和Gemini在记忆、图像编辑等功能上的优势。部分用户已看到测试版记忆功能,但全面推送时间未定。

4. 多模态能力拓展
即将推出视觉功能(通过手机摄像头解析环境)、图像风格修改工具,以及Google Drive集成,增强艺术创作和办公场景适用性。

5. 战略转型信号
通过Grok Workspaces协作白板等更新,xAI正将产品从”毒舌问答机”重塑为严肃生产力工具。Grok 3.5版本即将发布,4.0计划年底推出。

6. 关键挑战
记忆系统的实际效用功能整合度将决定Grok能否突破”网红玩具”印象,成为用户真正的首选AI助手。

OpenAI新一代AI模型:隐形渗透数字生活的”基础设施”

原文链接:

Avoiding ChatGPT won’t keep OpenAI from infusing its AI models into your life


by:
Eric Hal Schwartz


<span style="font-weight:bold;color:#299E59;font-size:24px;">OpenAI新一代AI模型:隐形渗透数字生活的”基础设施”</span>

1. 隐形AI渗透
OpenAI发布专为开发者设计的GPT-4.1等新模型,这些模型将悄无声息地嵌入各类应用(如邮箱、待办清单、食谱软件),用户可能毫无察觉地日常使用AI。

2. 技术特性突破
新模型针对指令执行、编码和信息推理优化,具有更高速度与成本效益,适合资源有限的开发者实现智能功能(如自动分类开支、生成会议摘要)。

3. 从产品到基础设施
AI正转变为“数字 plumbing”——像Wi-Fi一样隐形存在,失败时才被注意。这种转变可能提升公众接受度,但模糊了”AI使用者”的定义。

4. 隐忧与争议
透明度缺失:多数应用不会主动披露使用AI,尤其基础功能场景
隐私边界模糊:智能预测功能可能演变为监控(如购物推荐)
技术垄断风险:数字生活将被少数不透明的底层模型塑造

5. 用户的两难选择
抵制AI将变得极其困难——要么彻底审查每个应用的用户协议,要么接受AI对数字世界的隐形改造