[AI]《Rethinking the AI Scientist: Interactive Multi-Agent Workflows for Scientific Discovery》L Weidener, M Brkić, M Jovanović, R Singh... (2026)科学发现的范式正在发生剧变。如果说 AlphaFold 获得诺贝尔奖标志着 AI for Science 时代的开启,那么 Deep Research 的出现则预示着 AI 科学家正从昂贵的黑盒演变为触手可及的协作者。以下是关于这一前沿系统 Deep Research 的深度解读。1. 告别黑盒:从批处理到实时协作目前的 AI 科学家系统,如 Sakana 或 Google 的方案,大多采用批处理模式。研究人员输入一个课题,等待数小时甚至十几天,最后得到一份报告。这种黑盒过程排除了人类的实时引导。Deep Research 将研究周期从小时级缩短至分钟级。它认为,科学发现不应是漫长的等待,而应是一场人类与 AI 之间高频互动的对话。2. 核心架构:多智能体协同的实验室Deep Research 并非单一的大模型,而是一个由专业智能体组成的团队。规划者负责统筹,数据分析师负责代码与统计,文献专家检索海量论文,创新检测器负责评估假设的原创性。这些角色通过一个持续的“世界状态”连接,确保在多轮迭代中,研究背景和中间结论不会丢失。3. 世界状态:AI 的科研长效记忆传统 AI 在长对话中容易遗忘关键细节。Deep Research 引入了持久化世界状态,它不仅记录对话,更动态维护着当前的科研目标、已验证的假设、发现的洞察以及数据集描述。这种结构化记忆让 AI 能够像真正的科学家一样,在失败中学习,在积累中进化。4. 数据分析:不仅是生成代码,更是理解逻辑在 BixBench 计算生物学基准测试中,Deep Research 的数据分析智能体表现惊人。它在开放式回答上的准确率达到 48.8%,在多选题上达到 64.5%,远超 GPT-5 和 Claude 等基准。它的强大之处在于“知识引导的迭代”:它会根据代码运行结果不断修正内部知识库,这种自我纠错能力是复杂科研任务成功的关键。5. 两种模式:灵活性与自主性的平衡系统支持半自主和全自主两种模式。在半自主模式下,AI 会在遇到矛盾、意图模糊或研究收敛时设置检查点,询问人类专家的意见。这种人机协作模式避免了 AI 在错误方向上狂奔,让研究者的直觉与 AI 的算力完美结合。6. 局限性:开放获取的边界与创新的定义尽管强大,Deep Research 仍面临挑战。由于版权限制,它主要依赖开放获取(Open Access)文献,这可能导致它错过付费墙后的前沿成果。此外,自动化创新检测仍是一个难题。语义上的相似并不等同于科学意义上的重复,如何精准定义“新颖性”依然是 AI 科学家的终极挑战。7. 深度思考:AI 正在重塑科研的摩尔定律AI 科学家并不是要取代人类,而是要将科学家从繁琐的数据清洗和文献检索中解放出来。真正的智能不在于一次性给出正确答案,而在于不断修正假设的韧性。当科研的反馈周期从月缩短到分钟,科学发现的摩尔定律将正式生效。8. 开源与资源BioAgents 的编排框架已在 GitHub 开源,旨在推动社区共同构建更透明、可复现的 AI 科学工作流。项目链接:github.com/bio-xyz/BioAgents论文链接:arxiv.org/abs/2501.12542








