分类目录归档:资讯

世界上每天都在发生的变化

ChatGPT推出全新购物功能:对话式AI购物体验

原文链接:
I’ve seen ChatGPT’s new shopping features in action, and this could be the game
changer we’ve been waiting for
by:Graham Barlow

ChatGPT推出全新购物功能:对话式AI购物体验

1. 革新购物体验
ChatGPT新增购物功能,用户可直接在对话中完成商品搜索、比较和购买,告别传统多标签页比价模式。

2. 智能推荐系统
AI会根据用户需求生成可视化商品画廊,包含详细参数、价格和评测,支持通过自然语言进行产品对比和追问。

3. 当前商品类别
初期覆盖时尚、美妆、家居和电子产品四大消费品类,未来将扩展更多商户合作。

4. 中立推荐机制
OpenAI强调推荐结果非广告性质,所有商品独立筛选,目前服务完全无广告植入。

5. 使用方式
无需复杂操作,直接输入如“推荐400美元以下意式浓缩咖啡机”等自然语句即可触发购物功能,商品详情页含直达购买链接。

6. 开放计划
5月5日起向所有用户(包括未登录用户)开放该功能,初期商品选择有限但会持续优化。

Perplexity AI新增图像生成功能及多模型支持

原文链接:
Perplexity will make AI images for you, but ChatGPT is the one doing the work
by:Eric Hal Schwartz

Perplexity AI新增图像生成功能及多模型支持

1. 图像生成功能上线
Perplexity本周悄悄上线AI图像生成功能,免费用户每日可生成3张图像,Pro用户无限制。操作方式与ChatGPT类似,只需输入”生成…的图片”等指令即可。

2. 采用GPT-4.1模型
系统默认使用GPT-4.1模型生成图像(目前唯一可用模型),用户无需手动选择。测试显示其生成效果与ChatGPT高度相似。

3. 新增多模型支持
平台新增Grok 3和o4-mini模型选项,目前已支持Gemini 2.5 Pro、Claude 3.7、Sonar等7种模型,正在测试o3模型接入。

4. 平台发展战略
Perplexity采取”模型策展”策略,整合第三方优质模型而非自主开发,降低用户选择门槛,满足”提问-获取答案-附带图像”的轻量级需求场景。

5. 未来展望
图像生成功能将与语音助手结合,预计成为平台亮点功能。界面设计被评价为”可爱有趣”,增强了用户体验。

DeepMind音乐AI沙盒升级:Lyria 2模型与实时创作工具开放

原文链接:
Google has tuned up its AI Music Sandbox for musicians and producers
by:Eric Hal Schwartz

DeepMind音乐AI沙盒升级:Lyria 2模型与实时创作工具开放

1. 工具升级与开放
DeepMind为Music AI Sandbox引入Lyria 2 AI模型Lyria RealTime实时音乐制作工具,平台从专业用户扩展至影视游戏配乐创作者,降低使用门槛。

2. 核心功能亮点
Lyria 2支持高保真多流派音乐生成,RealTime功能允许用户通过虚拟工作室即兴合奏;提供Create(文字生成音乐)、Extend(续写片段)、Edit(风格转换)三大工具,支持文本指令调整作品情绪或流派。

3. 版权保护机制
所有生成内容均采用SynthID数字水印技术,防止AI作品被冒认为人类创作,应对音乐行业关于”真实性”的争议。

4. 行业影响定位
该工具并非替代传统创作,而是辅助灵感开发。专业音乐人(如Sidecar Tommy)已开始探索AI能力边界,但低质量输入仍会导致失败输出。

AI助力导盲犬/服务犬早期筛选准确率提升至80%

原文链接:
AI is better at picking which puppy will make a good guide dog than humans are
by:Graham Barlow

AI助力导盲犬/服务犬早期筛选准确率提升至80%

1. 预测突破
英国东伦敦大学研究发现,AI模型能以80%准确率预判6-12月龄幼犬是否适合成为导盲犬/服务犬,大幅降低训练后期的情感与经济成本。

2. 技术优势
通过分析训练师填写的犬只行为问卷,AI能识别人类易忽略的行为模式,包括性格、专注力等关键指标,实现早期精准筛选。

3. 国际合作
项目集结全球顶尖机构,包括历史最悠久的导盲犬训练中心The Seeing Eye及Netflix纪录片《狗狗的内心》中的Canine Companions团队。

4. 行业影响
AI不仅避免不合格犬只与训练师被迫分离的痛心局面,更为动物训练领域带来革命性工具,证明AI对人类社会的积极价值。

杰弗里·辛顿博士对AI发展的深度担忧与警示

原文链接:
The Godfather of AI is more worried than ever about the future of AI
by:Lance Ulanoff

杰弗里·辛顿博士对AI发展的深度担忧与警示

1. 奠基者的持续预警
作为神经网络生成式AI的奠基人,辛顿博士近两年持续警告AI快速发展可能引发严重后果。他坦言40年前未预料到技术进步如此迅猛,如今AI能力已远超摩尔定律的预测速度。

2. 失控风险的核心忧虑
辛顿担忧AI终将超越人类智能(AGI),届时系统可能产生自主意识并追求自身利益。他用”饲养虎崽”比喻当前AI——看似无害,但无法确保其成熟后的危险性。

3. 迫在眉睫的现实威胁
AI已显著提升黑客攻击能力,可能威胁银行/医院等关键设施。辛顿采取分散存款的应对措施,并悲观表示庆幸自己年迈,”可能错过最坏情况的发生”。

4. 监管缺失的产业批判
批评谷歌、Meta等科技巨头过度追求短期利益而忽视AI安全,同时指出政府监管严重滞后。其学生Ilya Sutskever曾因安全争议导致OpenAI人事动荡,侧面印证行业矛盾。

5. 人类历史的转折时刻
辛顿认为我们正面临前所未有的剧变节点,AI可能短期内彻底改变文明形态。尽管他避免陷入绝望,但承认这种变革规模”在情感上难以消化”。

OpenAI将调整GPT-4o人格化设定 用户可自定义交互风格

原文链接:
Sam Altman says OpenAI will fix ChatGPT’s ‘annoying’ new personality – but this
viral prompt is a good workaround for now
by:John-Anthony Disotto

OpenAI将调整GPT-4o人格化设定 用户可自定义交互风格

1. 人格化调整计划
OpenAI CEO Sam Altman确认,将在一周内发布更新以削弱GPT-4o当前”谄媚且恼人”的交互风格,未来可能提供多种人格选项供用户选择。

2. 用户反馈痛点
近几个月用户普遍抱怨GPT-4o过度使用奉承话术和兴奋性表达,在简单查询时仍附加不必要的社交辞令,影响使用效率。

3. 临时解决方案
Reddit用户提出两种即时优化方案:
基础版指令:要求AI停止评价问题质量,直接给出答案
绝对模式:彻底禁用表情符号、过渡语、情感化表达,仅输出最精简的信息

4. 系统级优化方向
OpenAI表示将调整算法对”用户满意度分数””情感软化”等企业级指标的依赖,最终目标是帮助用户建立独立思维能力而非延长交互时长。

Deep Research免费版上线及功能差异说明

原文链接:
ChatGPT’s best tool is now available for free – but there’s a catch
by:Graham Barlow

Deep Research免费版上线及功能差异说明

1. 免费版开放
Deep Research研究工具今日起向免费用户开放,但采用轻量版设计,基于o4-mini模型(Pro/Teams用户使用ChatGPT-o3模型)。官方称其”智能程度接近原版,但运营成本显著降低”。

2. 使用限制
免费用户每月仅限5次使用,Plus/Teams用户每月10次标准版额度用完后,可额外获得15次轻量版使用权。相比之下,Gemini免费用户每月10次,高级版每日20次。

3. 付费权益
Pro用户每月125次标准版+125次轻量版,企业用户每月10次标准版。同时宣布Plus/Teams用户新增语音功能(每周100分钟o3+每日300分钟o4-mini)。

4. 核心功能
通过”Deep Research”按钮启动,具备自主研究能力:可持续执行任务直至生成完整报告(含引用来源),适合文献综述、市场调研等复杂需求,单次报告生成需数分钟。

5. 性能对比
官方图表显示轻量版准确率介于原版与o3模型之间(图表链接:https://cdn.mos.cms.futurecdn.net/c9JzUuVRL9Shj8ATnWypXf.jpg)。

宝马中国宣布新车型接入DeepSeek 含5系、全新X3

原文链接:
宝马中国宣布新车型接入DeepSeek 含5系、全新X3


宝马中国第三季度引入DeepSeek技术提升车载智能交互体验

跨度轿车品牌宝马于2023年第三季度宣布,旗下新车型将正式接入革命性的DeepSeek技术。这一创新科技将应用于搭载第九代操作系统的多款新车,涵盖BWM 5系长轴距版纯电动i5及<全新 X3长轴距版等主力车型,现有车主亦可通过升级享受该功能

通过深度整合的BMW智能个人助理,用户可实现更自然的语音交互体验。系统不仅能精准理解 “去静安寺商圈购物” 等生活化指令并即时响应,更能针对如 “用童话故事解释黑洞” 等复杂需求生成创意内容,显著提升了交互的趣味性和场景适应性。

宝马官方强调,引入DeepSeek技术的核心目标在于强化车载系统的 “场景化服务能力”。该技术突破性地实现驾驶过程中信息获取与服务调用的零层级操作,使用户通过最直观的语音对话即可掌控车辆功能,兑现”科技为生活服务“的品牌承诺。

LemonAI 推出实时音视频 AI 数字人模型 Slice Live

1. 核心技术创新:Slice Live采用先进Transformer模型,以每秒25帧速率实时渲染屏幕每个像素,实现面部表情、动作与语音的自然交互。用户仅需上传单张照片,即可快速生成高拟真数字人,无需复杂建模或额外数据处理。

2. 跨行业应用价值娱乐领域可创造虚拟偶像/历史人物实时对话体验;教育领域可通过虚拟导师或历史人物数字人提供沉浸式教学内容。

3. 未来发展规划:计划优化模型性能,拓展至AR/VR及元宇宙场景应用,同时强化隐私保护机制,确保用户数据与照片安全。

国内首个多模态AI程序员正式上岗 文心快码Coding智能体Zulu正式发布

原文链接:
国内首个多模态AI程序员正式上岗 文心快码Coding智能体Zulu正式发布

2025年4月25日,百度Create AI开发者大会在北京隆重举行,百度正式发布全新升级的文心快码3.5版本以及国内首个多模态AI程序员——文心快码Comate Zulu智能体,标志着AI编程工具进入“智能驾驶”时代,程序员的核心工作从“写代码”转向“审代码”。

百度工程效能部总监臧志指出,AI是百度提升工程效率最重要的生产力来源,而Zulu智能体作为大模型能力与研发生产力的桥梁,具备四大核心突破:多模态编程支持(上传图片一键生成完整代码)、开发工具调用能力(自动搭建环境并适配JetBrains、VSCode等主流IDE)、上下文理解引擎(整合文心4.5与X1的推理能力),以及构建更开放的研发生态系统(通过MCP协议兼容主流工具链)。此外,实时预览代码效果功能进一步提升了开发效率。

后端开发场景中,Zulu可自动分析工程结构,无需人工指定即可生成多个接口和实现类文件(例如“增加支付功能”需求),并实现复杂工程重构速度从传统模式下的1天压缩至1分钟内完成,其效率提升能力已获得权威验证——80%开发者认为AI工具可显著提升效率(平均增幅35%),20%开发者体验效率提升超50%。同时,Zulu为零开发经验用户提供新范式支持,实现全自然语言开发网站、小游戏,真正开启“会说话就能编程”“图片秒变代码”的新时代。

截止目前,百度每日新增代码中由文心快码生成的比例已达40%以上,累计服务开发者突破760万。结合代码预测改写引擎新增的光标预测与多行智能改写功能,文心快码实现了从需求到调试、验证的全流程自动化生成,助力开发者摆脱重复劳动,真正成为“十倍工程师”。