30秒,一句话,生成一个可交互的小程序?阿里系最新推出的AI助手“灵光”,号称能“把复杂变简单”。我上手实测——它到底有多“灵光”?结果有惊喜,也让人皱眉。

官方对灵光的介绍是“把复杂变简单的全模态AI助手”。那么什么是全模态呢?按它自己的解释,全模态就是AI不再只会“打字聊天”,而是能同时处理文字、图片、语音、3D模型、动画、地图、音视频等所有信息形式,并实时生成可交互的内容。
灵光有三大核心能力,分别是灵光闪应用,灵光对话,灵光开眼。我分别做一个测试:
01
灵光对话:图文并茂答你所问
不再甩给你大段文字,而是直接给出结构化的图文、3D 模型、可交互地图或动态图表。
我问了灵光一个问题:马上12月了,我想在12月中旬到无锡旅游,请帮我规划一个四天三晚的旅游行程,包括路线、景点简介、费用。
下面是它的回答:

这种图文并茂的呈现方式我还是第一次见,让人耳目一新。它根据需求,生成了一个旅游攻略,还非常贴心地给每天的旅游景点规划了主题。

再往下拉,更绝的是,出现了一个地图,按照总览、第一天到第四天,进行了更具象的路线呈现。

我点了一下第三天的禅意路线,即以褐色路线串联起灵山大佛、拈花湾等景点。令人意想不到的是,这地图是可以放大缩小的,这种互动性简直不要太方便。

在最后,还非常贴心地给出了费用清单,分为经济版和舒适版。怎么样,方便不?
02
灵光闪应用:30 秒“手搓”小程序
按官方说明,这是“说一句话即可生成真正可运行的小应用”,比如健身打卡、溏心蛋计时器、油车电车成本对比……生成后即可编辑、分享,还能调用大模型实时交互。

可无论是PC端还是移动端,没有找到闪应用指令的输入框,只能测试了一下官方指定的案例“做一个腹式呼吸训练的互动小应用”。具体内容需要包括:多种科学呼吸模式(4-7-8、盒式呼吸等);实时可视化呼吸指导动画;需要有开始、暂停、重置等这几个按钮;需要显示当前呼吸循环的进度。"

大概30秒,即生成以上小应用。选择“4-7-8呼吸法”,点开始,即开始吸气倒计时、屏息倒计时、呼气倒计时,此为一个循环。以此类推,连做五个。
生成的应用还可以通过社交软件分享给朋友。
03
灵光开眼:万物皆可“看懂+创作”
在移动端的“灵光”APP中,打开相机,对准任何物体或场景,实时获得语音+文字的讲解;还能一键把眼前的画面变成文生图、图生视频等创意作品。
我把相机对准了一个车模,画面自动生成如下提示:

首先它提示,这是一个红色复古敞篷老爷车。同时衍生出一些推测大家感兴趣的问题,比如“复古敞篷车的设计灵感来自哪些年代?”、“合金材质在汽车模型中有什么优势?”。
点击最顶部“创作”,即进入视频创作和图片创作部分。我发出一个指令,让这辆车跑起来。于是生成了一段五秒钟的汽车奔跑的视频。

又试了一下图片创作,把桌上的乳液放到平静的海面上。抠图非常丝滑,倒影也合逻辑。
04
能理解意图,但细节大翻车
测试到这里,我认为灵光软件确实“灵光”,能够输出一些其他AI所不具备的技能。既然如此,我想进一步对它测试。
我把2025年新增的中国科学院院士名单以图片格式发给灵光,提示词如下:请将名单中的人物按其单位所在的省份进行归类,解放军的单独一类,制成一个表格,包括省份,人数,哪个单位的哪个人。要求所有省份都列出来。
很快,给出了以下结果:

另外,对学科进行了分析:

最后,进行了年龄分析。

显然,它知道我想干什么,所以有些内容提前做到了。
我提出了第二个要求:请按以上表格生成一张中国地图,10人以上的省份标注为橙色,5到9人的标注为红色,2到4人的标注为黄色,1人的标注为蓝色,没有提到的省份都标注为白色。

结果生成以上地图。猛一看像那么回事,可实际上错误百出。这里特别强调一下,这地图是AI生成的,不具有任何实际意义。
再回过头来看院士分类,是不是能完全相信呢?
我随手做了个检测,发现问题太多。

仅以北京为例,蓝色加粗字体的是灵光提到的没有问题的,而红色字体是它漏掉的。
再说年龄。平均年龄是对的,但却忽略了最小年龄44岁这个事实,而直接写成了46岁。可见,AI虽然能理解我的要求,但在精细化方面,还有待加强。
总体来看,灵光在“理解意图”和“交互创新”上确实有独到的地方,它能看懂你的需求,并尝试用更直观的方式回应你。但在细节还原与精准执行上,它依然会“翻车”。你是否也试过灵光?欢迎分享你的体验。