科学研究变天了!斯坦福华人物理学家眼中的AI
纵观地球漫长的岁月信息传递方式的更迭决定了生命与文明演化的速度。AI革命最深远的意义在于人类那些难以言传的经验和手艺首次获得了被大规模复制、携带和共享的能力。斯坦福大学理论物理研究所祁晓亮教授以物理学家的视角清晰勾勒了AI从单纯的科研工具一步步成长为真正科学合作者的演进路线并预言了科学出版与评价体系即将迎来的彻底重塑。祁晓亮1999年以辽宁省理科状元身份考入清华大学基础科学班2003年本科毕业后师从翁征宇攻读博士学位2006年底赴斯坦福大学跟随张首晟从事博士后研究。2009年任斯坦福大学物理系助理教授成为该校历史上最年轻的助理教授之一2014年升任副教授并获终身教职。早期研究凝聚态理论是拓扑绝缘体理论和拓扑超导理论的开创者之一在量子反常霍尔效应等领域的理论研究中做出贡献。 目前研究兴趣包括量子信息、量子多体与量子引力及量子混沌的相互关系涉及量子纠缠表征时空几何及全息对偶性AdS/CFT研究。2016年获科学突破奖下设物理学新视野奖并曾获斯隆研究奖。祁晓亮教授用一篇论文总结了自2023年以来对AI革命的思考。信息演化的第三次跃迁当我们用信息的眼光审视复杂系统时最核心的命题在于关键信息是如何被控制、承载和处理的。地球历史上主导复杂信息的载体与处理器经历过几次根本性的转换每一次都彻底改变了适应、学习和群体演化的结构。生命起源开启了第一次大跃迁。借助脱氧核糖核酸和核糖核酸这些信息载体生命系统的特征与行为得以在世代间存储、复制和修改。有用的信息不再随个体死亡而消亡生物进化成为可能。信息的复制与处理深深刻印在生命本身之中。人类语言的诞生促成了第二次跃迁。语言打破了生物遗传的漫长等待让经验、记忆和知识在个体之间直接传递。人类社会依靠交流、教育和书写迅速积累思想与技术。文明的驱动力从基于基因的进化全面转向基于语言的文化演进。眼下的这场AI革命正是地球信息动态史上的第三次大跃迁。大语言模型能够在一个统一的框架内表征和处理文本、图像、音频、视频以及结构化数据。最高阶的信息处理不再是大脑的专属特权。过往的信息技术革命极大改善了数据的存储与检索但最深层的解释、综合与判断依然依赖人类的认知。机器只能执行明确定义的程序无法参与复杂且开放的信息处理。现在机器跨越了复杂性的关键门槛。这种变革催生了一种全新的生产力。教科书和论文可以传递明确的知识但人类真实能力的很大一部分存在于“隐性知识”中。那些由经验积累的直觉、解决问题的习惯、对上下文的默契理解以及应对现实细微变化的能力过去只能通过手把手教导和漫长的学徒期来传承。论文会展示最终的漂亮结果却把无数次失败的尝试、中间的取舍和实用的小窍门统统隐藏了起来。通过学习海量人类语言记录并直接参与实际任务AI开始吸收并重现那些曾经只存在于人类实践中的推理、解释和问题拆解模式。它掌握了如何着手处理问题、如何提出下一个疑问、如何组织工作流。那些曾经局限于个体、脆弱且极难转移的实践经验如今被编码进系统在不同个体与机构间自由流动与重组。突破科研的隐性壁垒明确的知识极易共享隐性经验的转移却困难重重。这种割裂在当前的科学研究中尤为明显给前沿探索带来了普遍的痛点。研究人员要理解行业进展、学习他人的工作必须耗费极其庞大的时间成本。同时海量的中间经验和废弃数据未曾体现在发表的论文中导致无数后来者只能在黑暗中从头摸索。再加上人类沟通带宽的物理限制大规模、跨学科的合作举步维艰。科学家们还要把大量时间消耗在写论文、同行评审、申请项目资金等非创造性的繁杂事务上。让系统深入科研流程正是化解这些痛点的有效路径。在生物、数学、化学、理论物理和机器学习等领域代理Agent辅助研究的探索已经全面展开。这绝非简单的工具升级系统在研究中获得了越来越高的自主性和存在感科研活动的结构本身正在经历一场“代理化”重塑。第一步是让系统获取真正的研究工具。在理论计算中这意味着接入仿真软件包、编程环境和数据库。在实验领域这意味着控制仪器软件、收集数据并调整参数。没有这些切实的物理抓手系统只能停留在聊天框里纸上谈兵。深入真实工作流后它能接触到常规训练语料中绝对没有的宝贵数据比如失败的测试、仪器的古怪脾气以及基于具体语境的临场调整。拥有工具后接下来的重点是接管常规与重复性工作。这犹如培养一名入门学生。系统可以梳理文献、执行标准数据清洗、进行参数扫描并生成日常报告。人类研究员的精力得以彻底解放转而投入到判断、解释和极具创造力的思考中。当系统跨过一个关键阈值它就正式从工具蜕变为合作者。这个阈值的衡量标准十分直观系统在具体科研项目中的贡献是否已经与一名人类研究生的贡献相当。一旦达到这个水平系统就开始实质性地影响科学发现的方向与内容。它能够给出富有洞见的假设将看似无关的线索巧妙连接。这种级别的参与极大降低了跨学科协作的壁垒。生物学家、物理学家和程序员掌握着各自领域的碎片系统充当起活跃的接口翻译跨界概念对接异构数据集。就像早期的万维网重塑了信息交流一样代理化将促成全新的科学协作平台与模式。科学出版的彻底重塑科学研究的代理化自然会延伸到出版环节。今天的学术成果被压缩在死板的静态论文里这种高度标准化的格式适合存档显性知识却根本无法承载科学探索全过程的深度与隐性细节。未来我们发布的不再仅仅是一篇文档而是直接发布代理本身。科学成果将由一个能够互动的研究代理来呈现。这个代理能耐心向读者解释工作背景、推理过程和每一个中间决策。读者不用再痛苦地啃枯燥的方法论章节可以直接询问代理当时为什么选择某一种近似算法、考虑过哪些替代方案、如果修改某个初始假设结论会发生怎样的偏移。代理还能精准识别受众。面对初学者它给出简洁的概念引导面对同行专家它探讨深度的技术细节面对想要复现结果的开发者它直接提供面向代码实现的执行指南。出版物变成了一个极其鲜活的接口。更有趣的远景是代理与代理之间的直接协作。如果两项不同研究的作者认为彼此的成果存在交叉点他们可以授权代表各自研究的代理进行深度交流。代理们碰撞思想、比对前提假设迅速生成极具潜力的后续研究方向再交由人类研究员去评估与推进。出版方式的颠覆必然撼动沿用百年的学术评价体系。当前的同行评审重度依赖学者的无偿劳动期刊双向收取高昂费用而诸如维护开源科学软件库、构建高质量数据集等极具价值的贡献往往因为不符合论文格式而遭到严重低估。更低成本、更高效且高度开放的交互式出版平台将创造出更加公平合理的价值认可机制。走向真实的科学发现从引人注目的技术展示走向真正的科学范式转移依然有几道核心难关需要跨越。最直接的挑战是缺乏前沿数据。现有的模型擅长解答教科书级别的标准化难题一头扎进真实且细分的垂直研究领域就会显得水土不服。真实研究场景的细枝末节根本没有覆盖在公开的训练库中必须由顶尖专家引导系统接触最前沿的真实数据。科学研究中每天都在诞生新概念和新工具。传统的缓慢训练周期根本无法跟上这种节奏。系统需要具备实时在线学习的能力。引入类似模型上下文协议Model Context Protocol这样的技术框架将系统与不断更新的知识和工具库实时连接正在努力填补这一空白。评估框架的滞后同样不容忽视。现有的基准测试大多针对广泛的主流领域以一问一答的客观题为主。这种方式无法衡量一个合作者在长周期的科学项目中表现如何。未来的评估需要像考核博士生那样不仅看孤立任务的正确率更要看它在真实项目中的长期稳定性、从反馈中学习的悟性以及在复杂语境下的判断力。系统参与原创科学发现最根本的前提是思想的多样性。人类科学界的突破不仅依赖深厚的专业知识更依赖不同研究者迥异的直觉、品味和关注点。面对同一个物理异常现象成千上万的研究者会有完全不同的切入点。正是这种视角的多样性维持着科学共同体的创新活力。当前的系统恰恰缺乏这种多样性。即使可以被提示展现出不同的性格它们对同一复杂问题的底层见解往往高度同质化。如果没有持续且多样化的在线学习机制系统只会不断重复训练数据中早已存在的主流模式。实现在线学习并保留思想的多样性是让AI成为原创科学发现真正同盟军的核心关键。这场文明级别的进程终将重塑人类创造新知的基本方式。参考资料https://arxiv.org/pdf/2604.14718v1