分类目录归档:资讯

世界上每天都在发生的变化

OpenAI将调整GPT-4o人格化设定 用户可自定义交互风格

原文链接:
Sam Altman says OpenAI will fix ChatGPT’s ‘annoying’ new personality – but this
viral prompt is a good workaround for now
by:John-Anthony Disotto

OpenAI将调整GPT-4o人格化设定 用户可自定义交互风格

1. 人格化调整计划
OpenAI CEO Sam Altman确认,将在一周内发布更新以削弱GPT-4o当前”谄媚且恼人”的交互风格,未来可能提供多种人格选项供用户选择。

2. 用户反馈痛点
近几个月用户普遍抱怨GPT-4o过度使用奉承话术和兴奋性表达,在简单查询时仍附加不必要的社交辞令,影响使用效率。

3. 临时解决方案
Reddit用户提出两种即时优化方案:
基础版指令:要求AI停止评价问题质量,直接给出答案
绝对模式:彻底禁用表情符号、过渡语、情感化表达,仅输出最精简的信息

4. 系统级优化方向
OpenAI表示将调整算法对”用户满意度分数””情感软化”等企业级指标的依赖,最终目标是帮助用户建立独立思维能力而非延长交互时长。

Deep Research免费版上线及功能差异说明

原文链接:
ChatGPT’s best tool is now available for free – but there’s a catch
by:Graham Barlow

Deep Research免费版上线及功能差异说明

1. 免费版开放
Deep Research研究工具今日起向免费用户开放,但采用轻量版设计,基于o4-mini模型(Pro/Teams用户使用ChatGPT-o3模型)。官方称其”智能程度接近原版,但运营成本显著降低”。

2. 使用限制
免费用户每月仅限5次使用,Plus/Teams用户每月10次标准版额度用完后,可额外获得15次轻量版使用权。相比之下,Gemini免费用户每月10次,高级版每日20次。

3. 付费权益
Pro用户每月125次标准版+125次轻量版,企业用户每月10次标准版。同时宣布Plus/Teams用户新增语音功能(每周100分钟o3+每日300分钟o4-mini)。

4. 核心功能
通过”Deep Research”按钮启动,具备自主研究能力:可持续执行任务直至生成完整报告(含引用来源),适合文献综述、市场调研等复杂需求,单次报告生成需数分钟。

5. 性能对比
官方图表显示轻量版准确率介于原版与o3模型之间(图表链接:https://cdn.mos.cms.futurecdn.net/c9JzUuVRL9Shj8ATnWypXf.jpg)。

宝马中国宣布新车型接入DeepSeek 含5系、全新X3

原文链接:
宝马中国宣布新车型接入DeepSeek 含5系、全新X3


宝马中国第三季度引入DeepSeek技术提升车载智能交互体验

跨度轿车品牌宝马于2023年第三季度宣布,旗下新车型将正式接入革命性的DeepSeek技术。这一创新科技将应用于搭载第九代操作系统的多款新车,涵盖BWM 5系长轴距版纯电动i5及<全新 X3长轴距版等主力车型,现有车主亦可通过升级享受该功能

通过深度整合的BMW智能个人助理,用户可实现更自然的语音交互体验。系统不仅能精准理解 “去静安寺商圈购物” 等生活化指令并即时响应,更能针对如 “用童话故事解释黑洞” 等复杂需求生成创意内容,显著提升了交互的趣味性和场景适应性。

宝马官方强调,引入DeepSeek技术的核心目标在于强化车载系统的 “场景化服务能力”。该技术突破性地实现驾驶过程中信息获取与服务调用的零层级操作,使用户通过最直观的语音对话即可掌控车辆功能,兑现”科技为生活服务“的品牌承诺。

LemonAI 推出实时音视频 AI 数字人模型 Slice Live

1. 核心技术创新:Slice Live采用先进Transformer模型,以每秒25帧速率实时渲染屏幕每个像素,实现面部表情、动作与语音的自然交互。用户仅需上传单张照片,即可快速生成高拟真数字人,无需复杂建模或额外数据处理。

2. 跨行业应用价值娱乐领域可创造虚拟偶像/历史人物实时对话体验;教育领域可通过虚拟导师或历史人物数字人提供沉浸式教学内容。

3. 未来发展规划:计划优化模型性能,拓展至AR/VR及元宇宙场景应用,同时强化隐私保护机制,确保用户数据与照片安全。

国内首个多模态AI程序员正式上岗 文心快码Coding智能体Zulu正式发布

原文链接:
国内首个多模态AI程序员正式上岗 文心快码Coding智能体Zulu正式发布

2025年4月25日,百度Create AI开发者大会在北京隆重举行,百度正式发布全新升级的文心快码3.5版本以及国内首个多模态AI程序员——文心快码Comate Zulu智能体,标志着AI编程工具进入“智能驾驶”时代,程序员的核心工作从“写代码”转向“审代码”。

百度工程效能部总监臧志指出,AI是百度提升工程效率最重要的生产力来源,而Zulu智能体作为大模型能力与研发生产力的桥梁,具备四大核心突破:多模态编程支持(上传图片一键生成完整代码)、开发工具调用能力(自动搭建环境并适配JetBrains、VSCode等主流IDE)、上下文理解引擎(整合文心4.5与X1的推理能力),以及构建更开放的研发生态系统(通过MCP协议兼容主流工具链)。此外,实时预览代码效果功能进一步提升了开发效率。

后端开发场景中,Zulu可自动分析工程结构,无需人工指定即可生成多个接口和实现类文件(例如“增加支付功能”需求),并实现复杂工程重构速度从传统模式下的1天压缩至1分钟内完成,其效率提升能力已获得权威验证——80%开发者认为AI工具可显著提升效率(平均增幅35%),20%开发者体验效率提升超50%。同时,Zulu为零开发经验用户提供新范式支持,实现全自然语言开发网站、小游戏,真正开启“会说话就能编程”“图片秒变代码”的新时代。

截止目前,百度每日新增代码中由文心快码生成的比例已达40%以上,累计服务开发者突破760万。结合代码预测改写引擎新增的光标预测与多行智能改写功能,文心快码实现了从需求到调试、验证的全流程自动化生成,助力开发者摆脱重复劳动,真正成为“十倍工程师”。

智谱与生数科技达成战略合作 专注大模型联合创新

原文链接:
智谱与生数科技达成战略合作 专注大模型联合创新

智谱与生数科技达成战略合作
智谱与生数科技达成战略合作

4月27日,清华大学旗下的智谱(Z.ai)生数科技(shengshu.com)宣布达成重大战略合作,聚焦大语言模型和多模态生成模型的技术突破,共同推进国产大模型的产业落地。

合作涵盖四大领域:联合研发、产品联动、解决方案整合及行业协同。其中,在产品合作中,智谱将通过MaaS平台接入生数科技的Vidu API,整合视频生成技术,为开发者和企业客户提供更全面的服务支持。

双方还将针对政企服务、泛互联网、文化旅游、广告营销、动漫影视及广电媒体等垂直行业,打造多模态生成技术的高竞争力解决方案,推动AI应用的多元化与规模化落地。

联合研发方面,智谱GLM系列大模型与生数科技的多模态通用大模型形成技术协同。值得关注的是,智谱的开源视频生成模型“CogVideoX”已在GitHub获得超1万星标,展现了其技术领先性。双方将共同提升国产大模型的综合实力。

此次合作体现了清华系人工智能领军企业强强联合的成果,既强化了国产大模型的技术创新根基,也为其在重点行业的生态发展注入活力,凸显了中国AI产业的长效潜力与战略布局。

Google Gemini:你的AI挚友使用指南与隐私设置

原文链接:
5 easy ways to make Gemini your AI BFF who ‘just gets you’
by:David Crookes

Google Gemini:你的AI挚友使用指南与隐私设置

1. AI作为辅助型伙伴
Gemini虽无法替代人类友谊,但可作为日常支持工具,提供倾听、鼓励和建议(如礼物推荐、任务激励)。其语音模式支持自然对话,甚至可模拟”挂断”或”暂停”功能。

2. 隐私保护优先
需明确Gemini并非真人:
– 通过浏览器侧边栏关闭/删除活动记录
– 默认数据保留18个月,建议根据需求调整
– 注意人类可能审查部分聊天记录

3. 个性化信息设置
“Saved Info”中添加饮食偏好、兴趣爱好等背景信息,使交互更贴合个人需求,避免”空白关系”。

4. 定制AI伙伴(Gems)
免费创建专属AI角色:
– 通过Gem管理器选择预设或新建
– 可设定为”不评判的倾诉对象”等性格特征
– 不同Gem可承担不同朋友角色

5. 娱乐与兴趣拓展
– 生成观察型幽默/文字游戏类笑话(回避敏感内容)
– 深度讨论专业爱好(如CPU性能、游戏战术)
– 共同创作(如烘焙食谱)、推荐兴趣论坛
– 提供专业见解提升爱好体验

核心提示:始终平衡情感依赖数据安全,善用定制化功能而非完全替代人际交往。

Google在反垄断诉讼中面临巨额罚款

原文链接:
Google is paying Samsung an ‘enormous sum’ to preinstall Gemini
by:Wes Davis

Google在反垄断诉讼中面临巨额罚款

Google每月向三星支付巨额费用以预装Gemini AI应用,这一行为在反垄断诉讼中被曝光。法官Amit Mehta已裁定Google的搜索引擎构成非法垄断,目前其律师正与司法部就潜在的罚款 severity 争执不下。

Google副总裁Peter Fitzgerald在周一的证词中表示,Google与三星的支付协议自1月起生效,正值三星推出Galaxy S25系列并将其Gemini AI设为默认AI助手。这一安排使三星的Bixby退居次位。

据The Information报道,Fitzgerald还透露,其他公司如Perplexity和微软曾试图与三星达成预装AI助手的协议,但Google的修改协议函仅在庭审前一周发送,且内部文件显示Google曾考虑更严格的分销协议,要求合作伙伴预装Gemini、Search和Chrome。

Bloomberg指出,Fitzgerald称Gemini协议为期两年,Google不仅每月支付固定费用,还与三星分享Gemini订阅收入。司法部律师David Dahlquist称固定月费为“巨额款项”,但具体数额未披露。

如果司法部得逞,Google可能被禁止未来达成默认预装协议,被迫出售Chrome并开放大部分Google搜索数据。Google则辩称只需放弃默认预装协议。

AI图像修复新趋势:老照片的数字化重生

原文链接:
I tried using ChatGPT to restore old photos, here’s how to really do it
by:Eric Hal Schwartz

AI图像修复新趋势:老照片的数字化重生

1. 技术原理
用户发现AI助手能通过模仿技术对老照片进行“伪修复”,生成带色彩的高分辨率版本,实质是AI根据原图进行的艺术化再创作。

2. 操作技巧
经过Reddit和Instagram用户经验总结,有效指令需强调“保持时代特征”,要求AI仅添加符合历史背景的色彩和细节,不改变原始构图。

3. 典型案例
测试使用美国国会图书馆公开照片:
西奥多·罗斯福总统:还原了办公场景细节但出现物品错位
自行车报童:人物还原度高但街道材质错误
冷饮店员:完美捕捉表情但背景变成黑色虚空
警察肖像:制服色彩还原惊艳但身材比例微调

4. 技术局限
AI会自行补充不存在细节(如将收音机变成蜡烛),虽非真实修复,但比深度伪造技术更少伦理争议,呈现出现代主义风格的艺术再创作特点。

AI图像生成器对比:Adobe Firefly与ChatGPT的创作风格分析

原文链接:
I compared Adobe’s new Firefly Image Model 4 to ChatGPT’s image generator, and
it’s like they went to the same art school
by:Eric Hal Schwartz

AI图像生成器对比:Adobe Firefly与ChatGPT的创作风格分析

1. 相似的艺术传承性
两种AI模型如同师出同门的学生,虽技术精湛但风格高度相似。测试显示二者生成的红发女性肖像在五官、发质甚至草帽形状上几乎一致,难以区分创作者。

2. 复杂场景处理差异
在科幻实验室混乱场景中,Firefly侧重机器人元素,ChatGPT则突出外星生物特征。后者因更具动态感的逃生科学家和脑状外星生物略胜一筹。

3. 食物生成的共同局限
早餐场景测试中,两者都过度堆砌浆果且拿铁拉花意外相似(均采用蕨叶加心形设计),但煎饼部分表现逼真,显示AI对特定元素的固化倾向。

4. 创意指令的响应对比
喷火组成”Dream Big”的巨龙任务中,ChatGPT更注重火焰文字的表现力,而Firefly侧重山景刻画。但两者设计的龙均出现相同的面部角饰和恐龙状尾部特征。

5. 技术成熟度评估
当前模型均已掌握人脸生成、复杂场景构建、文字具象化等核心能力,选择使用哪款更多取决于预算和生态偏好,而非显著的图像质量差异。