蚂蚁集团推出的全模态通用 AI 助手

打开

概览

阿里的「灵光」是蚂蚁集团在 2025 年 11 月正式推出的全模态通用 AI 助手,核心定位是“让复杂,变简单”,主打一句话就能在 30 秒内生成可交互、可分享的小应用(“闪应用”),并通过多模态输出把传统“聊天 AI”升级为真正的生产力与应用生成平台。

基本定位与背景

灵光由蚂蚁集团发布,是其 AGI(通用人工智能)战略下的核心级产品之一,延续了此前在大模型、医疗 AI 等方向的技术积累。平台的口号是“让复杂,变简单”,面向普通用户、职场人士和中小团队,希望让非技术人也能通过自然语言使用复杂 AI 能力。它与支付宝生态深度绑定,被视为阿里系争夺“AI 超级入口”(面向 C 端入口)的重要棋子。

三大核心功能

  • 灵光对话:在基础问答之外,支持直接输出 3D 模型、音视频、图表、动画、地图等多模态内容,回答时自动结构化排版,提升信息密度和可理解度。
  • 灵光闪应用:用户用一句自然语言描述需求(如“做一个房贷利率计算器”),系统会在 30 秒到 1 分钟内生成包含前端界面和后端逻辑的可交互小应用,并可在对话中持续修改和个性化定制。
  • 灵光开眼:搭载 AGI 相机,通过实时视频流解析物理世界,实现对物体、场景的识别与讲解,并支持文生图/视频、图生图/视频等视觉创作能力,例如拍摄蔬菜自动生成菜谱或对准建筑自动讲解信息。

技术与多模态特色

灵光是“全模态”助手,融合语言、图像、语音和数据的理解与生成,支持输出 3D 数字模型、音频、图表、动画、地图等,远超单一文本型助手。其一大技术卖点是“全代码生成多模态内容”,即不仅生成界面,还能生成可运行逻辑,使生成的闪应用具备真正的工具属性而非静态展示。依托蚂蚁在支付与风控上的技术基础,灵光还强调面向金融、法务、物流等垂直行业的能力输出。

使用场景与体验

在 C 端,灵光主要用于健身计划制定、旅行规划、食谱生成、个人理财与账单管理、学习辅导等日常生活场景,并支持将生成的闪应用一键分享给他人使用。用户可以像和助手聊天一样迭代需求,例如先生成一个旅游计划应用,再让其增加预算控制、行程导出等功能,体验上类似“零门槛做产品”的低代码甚至“无代码”形态。在 B 端,灵光已开始与企业合作,提供文档分析、视觉识别等能力,帮助构建内部大模型服务平台。

与开发者工具的关系

灵光本身面向普通用户和业务人员,而阿里云面向开发者的智能编码助手是「通义灵码」,两者定位不同:一个是通用 AI 生活/办公助手和应用生成器,一个是深度集成在 IDE 里的代码助手。不过灵光的“全代码生成闪应用”能力,对你这样的技术用户来说,本质上是一个“自然语言 → 可运行小程序”的自动化开发通道,适合快速验证业务想法或为非技术同事做工具原型。