30秒一句话，生成可交互应用？灵光AI实测，细节翻车了！

30秒，一句话，生成一个可交互的小程序？阿里系最新推出的AI助手“灵光”，号称能“把复杂变简单”。我上手实测——它到底有多“灵光”？结果有惊喜，也让人皱眉。

官方对灵光的介绍是“把复杂变简单的全模态AI助手”。那么什么是全模态呢？按它自己的解释，全模态就是AI不再只会“打字聊天”，而是能同时处理文字、图片、语音、3D模型、动画、地图、音视频等所有信息形式，并实时生成可交互的内容。

灵光有三大核心能力，分别是灵光闪应用，灵光对话，灵光开眼。我分别做一个测试：

灵光对话：图文并茂答你所问

不再甩给你大段文字，而是直接给出结构化的图文、3D 模型、可交互地图或动态图表。

我问了灵光一个问题：马上12月了，我想在12月中旬到无锡旅游，请帮我规划一个四天三晚的旅游行程，包括路线、景点简介、费用。

下面是它的回答：

这种图文并茂的呈现方式我还是第一次见，让人耳目一新。它根据需求，生成了一个旅游攻略，还非常贴心地给每天的旅游景点规划了主题。

再往下拉，更绝的是，出现了一个地图，按照总览、第一天到第四天，进行了更具象的路线呈现。

我点了一下第三天的禅意路线，即以褐色路线串联起灵山大佛、拈花湾等景点。令人意想不到的是，这地图是可以放大缩小的，这种互动性简直不要太方便。

在最后，还非常贴心地给出了费用清单，分为经济版和舒适版。怎么样，方便不？

灵光闪应用：30 秒“手搓”小程序

按官方说明，这是“说一句话即可生成真正可运行的小应用”，比如健身打卡、溏心蛋计时器、油车电车成本对比……生成后即可编辑、分享，还能调用大模型实时交互。

可无论是PC端还是移动端，没有找到闪应用指令的输入框，只能测试了一下官方指定的案例“做一个腹式呼吸训练的互动小应用”。具体内容需要包括：多种科学呼吸模式（4-7-8、盒式呼吸等）；实时可视化呼吸指导动画；需要有开始、暂停、重置等这几个按钮；需要显示当前呼吸循环的进度。"

大概30秒，即生成以上小应用。选择“4-7-8呼吸法”，点开始，即开始吸气倒计时、屏息倒计时、呼气倒计时，此为一个循环。以此类推，连做五个。

生成的应用还可以通过社交软件分享给朋友。

灵光开眼：万物皆可“看懂+创作”

在移动端的“灵光”APP中，打开相机，对准任何物体或场景，实时获得语音+文字的讲解；还能一键把眼前的画面变成文生图、图生视频等创意作品。

我把相机对准了一个车模，画面自动生成如下提示：

首先它提示，这是一个红色复古敞篷老爷车。同时衍生出一些推测大家感兴趣的问题，比如“复古敞篷车的设计灵感来自哪些年代？”、“合金材质在汽车模型中有什么优势？”。

点击最顶部“创作”，即进入视频创作和图片创作部分。我发出一个指令，让这辆车跑起来。于是生成了一段五秒钟的汽车奔跑的视频。

又试了一下图片创作，把桌上的乳液放到平静的海面上。抠图非常丝滑，倒影也合逻辑。

能理解意图，但细节大翻车

测试到这里，我认为灵光软件确实“灵光”，能够输出一些其他AI所不具备的技能。既然如此，我想进一步对它测试。

我把2025年新增的中国科学院院士名单以图片格式发给灵光，提示词如下：请将名单中的人物按其单位所在的省份进行归类，解放军的单独一类，制成一个表格，包括省份，人数，哪个单位的哪个人。要求所有省份都列出来。

很快，给出了以下结果：

另外，对学科进行了分析：

最后，进行了年龄分析。

显然，它知道我想干什么，所以有些内容提前做到了。

我提出了第二个要求：请按以上表格生成一张中国地图，10人以上的省份标注为橙色，5到9人的标注为红色，2到4人的标注为黄色，1人的标注为蓝色，没有提到的省份都标注为白色。

结果生成以上地图。猛一看像那么回事，可实际上错误百出。这里特别强调一下，这地图是AI生成的，不具有任何实际意义。

再回过头来看院士分类，是不是能完全相信呢？

我随手做了个检测，发现问题太多。

仅以北京为例，蓝色加粗字体的是灵光提到的没有问题的，而红色字体是它漏掉的。

再说年龄。平均年龄是对的，但却忽略了最小年龄44岁这个事实，而直接写成了46岁。可见，AI虽然能理解我的要求，但在精细化方面，还有待加强。

总体来看，灵光在“理解意图”和“交互创新”上确实有独到的地方，它能看懂你的需求，并尝试用更直观的方式回应你。但在细节还原与精准执行上，它依然会“翻车”。你是否也试过灵光？欢迎分享你的体验。

群发资讯网