原文链接:
算法不重要,AI的下一个范式突破,「解锁」新数据源才是关键
算法不重要,AI的下一个范式突破,「解锁」新数据源才是关键
1. AI重大突破的四大里程碑
深度神经网络(2012年AlexNet)→ Transformer语言模型(2017年)→ RLHF(2022年)→ 推理模型(2024年),这四次范式转变均基于已有技术的新数据源应用,而非全新算法。
2. 突破的核心驱动力:数据而非算法
康奈尔大学博士生Jack Morris指出,AI进步的关键在于新数据源(如ImageNet、网络文本、人类反馈、验证器)的解锁。例如Transformer的爆发源于对互联网文本的高效利用。
3. 当前瓶颈与争议
尽管技术持续优化(如FlashAttention、推测解码等),但近期模型(如GPT-4.5)改进有限,数学能力仅达人类5%。研究表明,数据质量上限可能制约模型性能,而非训练技巧。
4. 未来突破方向预测
下一个范式可能来自:
– YouTube视频数据(每分钟500小时上传,含语音/视觉/文化信息)
– 机器人实体数据(传感器与环境的交互数据)
关键结论:AI进步需聚焦新数据源挖掘,而非算法创新。
5. 研究生态反思
全球去中心化研究(如arXiv、开源模型DeepSeek-R1)推动效率提升,但需警惕对“数据决定论”的过度依赖,平衡基础理论与工程实践。