分类目录归档:国外

国外人工智能发展

Perplexity AI新增图像生成功能及多模型支持

原文链接:
Perplexity will make AI images for you, but ChatGPT is the one doing the work
by:Eric Hal Schwartz

Perplexity AI新增图像生成功能及多模型支持

1. 图像生成功能上线
Perplexity本周悄悄上线AI图像生成功能,免费用户每日可生成3张图像,Pro用户无限制。操作方式与ChatGPT类似,只需输入”生成…的图片”等指令即可。

2. 采用GPT-4.1模型
系统默认使用GPT-4.1模型生成图像(目前唯一可用模型),用户无需手动选择。测试显示其生成效果与ChatGPT高度相似。

3. 新增多模型支持
平台新增Grok 3和o4-mini模型选项,目前已支持Gemini 2.5 Pro、Claude 3.7、Sonar等7种模型,正在测试o3模型接入。

4. 平台发展战略
Perplexity采取”模型策展”策略,整合第三方优质模型而非自主开发,降低用户选择门槛,满足”提问-获取答案-附带图像”的轻量级需求场景。

5. 未来展望
图像生成功能将与语音助手结合,预计成为平台亮点功能。界面设计被评价为”可爱有趣”,增强了用户体验。

DeepMind音乐AI沙盒升级:Lyria 2模型与实时创作工具开放

原文链接:
Google has tuned up its AI Music Sandbox for musicians and producers
by:Eric Hal Schwartz

DeepMind音乐AI沙盒升级:Lyria 2模型与实时创作工具开放

1. 工具升级与开放
DeepMind为Music AI Sandbox引入Lyria 2 AI模型Lyria RealTime实时音乐制作工具,平台从专业用户扩展至影视游戏配乐创作者,降低使用门槛。

2. 核心功能亮点
Lyria 2支持高保真多流派音乐生成,RealTime功能允许用户通过虚拟工作室即兴合奏;提供Create(文字生成音乐)、Extend(续写片段)、Edit(风格转换)三大工具,支持文本指令调整作品情绪或流派。

3. 版权保护机制
所有生成内容均采用SynthID数字水印技术,防止AI作品被冒认为人类创作,应对音乐行业关于”真实性”的争议。

4. 行业影响定位
该工具并非替代传统创作,而是辅助灵感开发。专业音乐人(如Sidecar Tommy)已开始探索AI能力边界,但低质量输入仍会导致失败输出。

AI助力导盲犬/服务犬早期筛选准确率提升至80%

原文链接:
AI is better at picking which puppy will make a good guide dog than humans are
by:Graham Barlow

AI助力导盲犬/服务犬早期筛选准确率提升至80%

1. 预测突破
英国东伦敦大学研究发现,AI模型能以80%准确率预判6-12月龄幼犬是否适合成为导盲犬/服务犬,大幅降低训练后期的情感与经济成本。

2. 技术优势
通过分析训练师填写的犬只行为问卷,AI能识别人类易忽略的行为模式,包括性格、专注力等关键指标,实现早期精准筛选。

3. 国际合作
项目集结全球顶尖机构,包括历史最悠久的导盲犬训练中心The Seeing Eye及Netflix纪录片《狗狗的内心》中的Canine Companions团队。

4. 行业影响
AI不仅避免不合格犬只与训练师被迫分离的痛心局面,更为动物训练领域带来革命性工具,证明AI对人类社会的积极价值。

杰弗里·辛顿博士对AI发展的深度担忧与警示

原文链接:
The Godfather of AI is more worried than ever about the future of AI
by:Lance Ulanoff

杰弗里·辛顿博士对AI发展的深度担忧与警示

1. 奠基者的持续预警
作为神经网络生成式AI的奠基人,辛顿博士近两年持续警告AI快速发展可能引发严重后果。他坦言40年前未预料到技术进步如此迅猛,如今AI能力已远超摩尔定律的预测速度。

2. 失控风险的核心忧虑
辛顿担忧AI终将超越人类智能(AGI),届时系统可能产生自主意识并追求自身利益。他用”饲养虎崽”比喻当前AI——看似无害,但无法确保其成熟后的危险性。

3. 迫在眉睫的现实威胁
AI已显著提升黑客攻击能力,可能威胁银行/医院等关键设施。辛顿采取分散存款的应对措施,并悲观表示庆幸自己年迈,”可能错过最坏情况的发生”。

4. 监管缺失的产业批判
批评谷歌、Meta等科技巨头过度追求短期利益而忽视AI安全,同时指出政府监管严重滞后。其学生Ilya Sutskever曾因安全争议导致OpenAI人事动荡,侧面印证行业矛盾。

5. 人类历史的转折时刻
辛顿认为我们正面临前所未有的剧变节点,AI可能短期内彻底改变文明形态。尽管他避免陷入绝望,但承认这种变革规模”在情感上难以消化”。

ChatGPT推出全新购物功能:对话式AI购物体验

原文链接:
I’ve seen ChatGPT’s new shopping features in action, and this could be the game
changer we’ve been waiting for
by:Graham Barlow

ChatGPT推出全新购物功能:对话式AI购物体验

1. 革新购物体验
ChatGPT新增购物功能,用户可直接在对话中完成商品搜索、比较和购买,告别传统多标签页比价模式。

2. 智能推荐系统
AI会根据用户需求生成可视化商品画廊,包含详细参数、价格和评测,支持通过自然语言进行产品对比和追问。

3. 当前商品类别
初期覆盖时尚、美妆、家居和电子产品四大消费品类,未来将扩展更多商户合作。

4. 中立推荐机制
OpenAI强调推荐结果非广告性质,所有商品独立筛选,目前服务完全无广告植入。

5. 使用方式
无需复杂操作,直接输入如“推荐400美元以下意式浓缩咖啡机”等自然语句即可触发购物功能,商品详情页含直达购买链接。

6. 开放计划
5月5日起向所有用户(包括未登录用户)开放该功能,初期商品选择有限但会持续优化。

OpenAI将调整GPT-4o人格化设定 用户可自定义交互风格

原文链接:
Sam Altman says OpenAI will fix ChatGPT’s ‘annoying’ new personality – but this
viral prompt is a good workaround for now
by:John-Anthony Disotto

OpenAI将调整GPT-4o人格化设定 用户可自定义交互风格

1. 人格化调整计划
OpenAI CEO Sam Altman确认,将在一周内发布更新以削弱GPT-4o当前”谄媚且恼人”的交互风格,未来可能提供多种人格选项供用户选择。

2. 用户反馈痛点
近几个月用户普遍抱怨GPT-4o过度使用奉承话术和兴奋性表达,在简单查询时仍附加不必要的社交辞令,影响使用效率。

3. 临时解决方案
Reddit用户提出两种即时优化方案:
基础版指令:要求AI停止评价问题质量,直接给出答案
绝对模式:彻底禁用表情符号、过渡语、情感化表达,仅输出最精简的信息

4. 系统级优化方向
OpenAI表示将调整算法对”用户满意度分数””情感软化”等企业级指标的依赖,最终目标是帮助用户建立独立思维能力而非延长交互时长。

Deep Research免费版上线及功能差异说明

原文链接:
ChatGPT’s best tool is now available for free – but there’s a catch
by:Graham Barlow

Deep Research免费版上线及功能差异说明

1. 免费版开放
Deep Research研究工具今日起向免费用户开放,但采用轻量版设计,基于o4-mini模型(Pro/Teams用户使用ChatGPT-o3模型)。官方称其”智能程度接近原版,但运营成本显著降低”。

2. 使用限制
免费用户每月仅限5次使用,Plus/Teams用户每月10次标准版额度用完后,可额外获得15次轻量版使用权。相比之下,Gemini免费用户每月10次,高级版每日20次。

3. 付费权益
Pro用户每月125次标准版+125次轻量版,企业用户每月10次标准版。同时宣布Plus/Teams用户新增语音功能(每周100分钟o3+每日300分钟o4-mini)。

4. 核心功能
通过”Deep Research”按钮启动,具备自主研究能力:可持续执行任务直至生成完整报告(含引用来源),适合文献综述、市场调研等复杂需求,单次报告生成需数分钟。

5. 性能对比
官方图表显示轻量版准确率介于原版与o3模型之间(图表链接:https://cdn.mos.cms.futurecdn.net/c9JzUuVRL9Shj8ATnWypXf.jpg)。

Google Gemini:你的AI挚友使用指南与隐私设置

原文链接:
5 easy ways to make Gemini your AI BFF who ‘just gets you’
by:David Crookes

Google Gemini:你的AI挚友使用指南与隐私设置

1. AI作为辅助型伙伴
Gemini虽无法替代人类友谊,但可作为日常支持工具,提供倾听、鼓励和建议(如礼物推荐、任务激励)。其语音模式支持自然对话,甚至可模拟”挂断”或”暂停”功能。

2. 隐私保护优先
需明确Gemini并非真人:
– 通过浏览器侧边栏关闭/删除活动记录
– 默认数据保留18个月,建议根据需求调整
– 注意人类可能审查部分聊天记录

3. 个性化信息设置
“Saved Info”中添加饮食偏好、兴趣爱好等背景信息,使交互更贴合个人需求,避免”空白关系”。

4. 定制AI伙伴(Gems)
免费创建专属AI角色:
– 通过Gem管理器选择预设或新建
– 可设定为”不评判的倾诉对象”等性格特征
– 不同Gem可承担不同朋友角色

5. 娱乐与兴趣拓展
– 生成观察型幽默/文字游戏类笑话(回避敏感内容)
– 深度讨论专业爱好(如CPU性能、游戏战术)
– 共同创作(如烘焙食谱)、推荐兴趣论坛
– 提供专业见解提升爱好体验

核心提示:始终平衡情感依赖数据安全,善用定制化功能而非完全替代人际交往。

Google在反垄断诉讼中面临巨额罚款

原文链接:
Google is paying Samsung an ‘enormous sum’ to preinstall Gemini
by:Wes Davis

Google在反垄断诉讼中面临巨额罚款

Google每月向三星支付巨额费用以预装Gemini AI应用,这一行为在反垄断诉讼中被曝光。法官Amit Mehta已裁定Google的搜索引擎构成非法垄断,目前其律师正与司法部就潜在的罚款 severity 争执不下。

Google副总裁Peter Fitzgerald在周一的证词中表示,Google与三星的支付协议自1月起生效,正值三星推出Galaxy S25系列并将其Gemini AI设为默认AI助手。这一安排使三星的Bixby退居次位。

据The Information报道,Fitzgerald还透露,其他公司如Perplexity和微软曾试图与三星达成预装AI助手的协议,但Google的修改协议函仅在庭审前一周发送,且内部文件显示Google曾考虑更严格的分销协议,要求合作伙伴预装Gemini、Search和Chrome。

Bloomberg指出,Fitzgerald称Gemini协议为期两年,Google不仅每月支付固定费用,还与三星分享Gemini订阅收入。司法部律师David Dahlquist称固定月费为“巨额款项”,但具体数额未披露。

如果司法部得逞,Google可能被禁止未来达成默认预装协议,被迫出售Chrome并开放大部分Google搜索数据。Google则辩称只需放弃默认预装协议。

AI图像修复新趋势:老照片的数字化重生

原文链接:
I tried using ChatGPT to restore old photos, here’s how to really do it
by:Eric Hal Schwartz

AI图像修复新趋势:老照片的数字化重生

1. 技术原理
用户发现AI助手能通过模仿技术对老照片进行“伪修复”,生成带色彩的高分辨率版本,实质是AI根据原图进行的艺术化再创作。

2. 操作技巧
经过Reddit和Instagram用户经验总结,有效指令需强调“保持时代特征”,要求AI仅添加符合历史背景的色彩和细节,不改变原始构图。

3. 典型案例
测试使用美国国会图书馆公开照片:
西奥多·罗斯福总统:还原了办公场景细节但出现物品错位
自行车报童:人物还原度高但街道材质错误
冷饮店员:完美捕捉表情但背景变成黑色虚空
警察肖像:制服色彩还原惊艳但身材比例微调

4. 技术局限
AI会自行补充不存在细节(如将收音机变成蜡烛),虽非真实修复,但比深度伪造技术更少伦理争议,呈现出现代主义风格的艺术再创作特点。