从写文章到看病，AI 到底靠不靠谱

本文仅在今日头条发布，谢绝转载

遥波/文

近日，英国一警察局承认，在一起有关欧洲足球比赛安全评估的决策中使用了 AI 助手 Microsoft Copilot，该工具生成了一份包含错误信息的情报报告，使警方错误地将某场比赛定为高风险事件，并禁止对方球迷入场。警方随后向英国议会道歉，并因错误引用 AI 输出而遭致批评。这一事件引发对 AI 在公共决策中使用不当的反思。

这个案例揭示了一个核心问题：当 AI 给出的搜索结果或判断看起来很“专业”时，它到底有多可信？要正确评估 AI 的价值，我们不能只停留在感受层面，而不妨从写作、看病、健康建议和日常生活这些具体场景入手，对照现有的数据和研究，看它究竟能帮到哪里，又容易在哪儿出错。

一、写作与文献整合：效率高但要警惕“幻觉”

在写作方面，AI 的表现堪称高效。根据麦肯锡2023 年一份报告，生成式 AI 可使知识工作者在“文本整理与创作任务”上提升 30%—60% 的效率。这种快速梳理信息、归纳观点的能力，在高校写作与资料整理中受到欢迎。

然而，AI 的输出并不等于权威。所谓的“AI 幻觉” 指的是模型生成看似合理但完全不真实的信息。在多个独立评估中发现，大量 AI 回答包含缺失、错误或误导引用来源——在一项由媒体专业记者评估的测试中，45% 的 AI 回答存在至少一个重大问题，其中 31% 出现严重的信息来源问题。

因此，在写作时，AI 最适合作为辅助工具：帮助搭建结构、启发思路，而所有引用与数据仍需人工查证原始出处。

二、疾病判断：常见病表现不错，但复杂病远未成熟

在医疗领域，人们越来越习惯在 AI 上查询疾病判断。据相关调研显示，使用 AI 或生成式助手寻求健康建议的用户比例在不断上升。一项针对全球用户健康搜索行为的调查发现，超过三成用户曾用 AI 询问症状分析。

对于常见病症，如普通感冒、轻度胃肠不适、睡眠问题等，AI 依据统计模型提供的建议通常与临床常规相符。然而，AI 并不具备临床观察能力——无法进行体检、医学影像分析或结合个体历史数据进行整体判断。因此，对于复杂病因或罕见症状，AI 的诊断建议不可作为替代医生的唯一判断。

世界卫生组织在其关于 AI 与医疗伦理的报告中明确指出：人工智能不能替代专业医师进行诊断与治疗决策。这意味着，尽管 AI 能作为初期信息参考工具，其结论仍需医生专业判断作进一步验证。

三、健康养生建议：整体可信，问题越具体越有效

相较于医学诊断，AI 在健康管理与养生建议领域表现更稳定，这主要得益于该领域存在大量成熟共识。例如，建议合理膳食、适度运动、健康作息等内容本身已有大量权威指南支持。

只要问题足够具体，如“高血压患者该如何调整饮食？”或“久坐族如何缓解下背疼痛？”，AI 给出的建议往往贴合当前医学指南，并具备一定实用性。而这类建议通常来自于主流公共卫生原则，与专业营养师和健康顾问的日常建议一致。

不过需要注意的是，AI 提供的健康建议仍然是通用性的，并不能取代个性化的专业诊断与处方。

四、日常生活建议：信息入口有用，但执行效果待检验

在规划旅行、寻找家政服务等日常生活场景中，AI 提供的信息整合作用也日益显现。例如，当用户询问“附近有哪些保姆公司可选？”时，AI 可以迅速给出相关平台和服务列表，节省用户筛选信息的时间。

然而，这类建议的真正价值取决于现实执行效果：AI 可以推荐服务名单，但无法保证服务质量、人员专业度或服务体验。正如你提到的使用体验一样，AI 找到了保姆公司信息，但实际效果仍需用户自行检验与决策。

因此，在日常生活领域，AI 更像是一个 “信息导航器”，其输出为用户节省了搜索成本，但不能替代现实的体验验证。

五、理性看待 AI 搜索结果：可信但别盲信

综合来看，AI 给出的搜索结果并非完全不可信，但也不能被盲目相信。它在写作与资料整合方面确实极大提升效率；在健康与养生建议方面通常比较稳健；在医疗诊断与复杂判断中具有参考价值；而在日常生活建议中则主要充当信息入口。

重要的是要认识到：AI 仍是基于概率推理的工具，其输出可能包含偏差、错误甚至幻觉。因此，AI 最适合定位为辅助决策的“智能助手”，而非最终的权威结论来源。用户应结合权威资料、专业意见与自身判断能力，理性使用 AI。

在这个信息时代，让 AI 来帮我们“快速找到答案”，固然便利；但保持对证据与来源的怀疑态度，才是建立长期可信判断的根本。

群发资讯网

从写文章到看病，AI 到底靠不靠谱

热门分类