螞蟻集團近日正式推出全模態通用AI助手“靈光”,在移動端實現“30秒生成小應用”的突破性功能,支持用戶編輯、交互與分享。這款產品不僅成為業內首個具備全代碼生成多模態內容能力的AI助手,更通過三大核心功能重新定義了通用型AI的生產力邊界。
“靈光對話”功能通過結構化思維引擎,將復雜信息轉化為邏輯清晰的分層展示。例如在教育場景中,用戶詢問科學原理時,系統不僅能提煉核心知識點,還能自動生成3D動態模型、交互式圖表等可視化內容。這種呈現方式使知識傳遞效率提升數倍,尤其在需要空間理解的學科領域表現突出。
產品架構層面,靈光采用多智能體協作的Agentic系統,動態調度圖像生成、3D建模、動畫渲染等專用模塊。當用戶發起請求時,系統會實時組合多個專業Agent的能力,確保輸出結果既包含精準信息又具備沉浸式體驗。這種設計突破了傳統AI助手單一模態輸出的局限,實現了從文本到三維空間的完整覆蓋。
最具創新性的“閃應用”功能,讓普通用戶通過自然語言對話即可創建個性化工具。用戶輸入“計算溏心蛋烹飪時間”后,系統能在30秒內生成包含雞蛋大小、熟度選擇等參數的交互式計算器。養車成本、健身計劃等場景同樣適用,所有應用均支持實時調用后端模型,實現數據動態更新與外部系統交互。
“靈光開眼”功能搭載的AGI相機技術,將物理世界觀察能力推向新高度。在旅游場景中,用戶對準古建筑拍攝時,系統能實時識別結構特征并疊加歷史信息解說;創作模式下支持文生視頻、圖生3D等跨模態轉換,為內容創作者提供全鏈路工具鏈。這種實時解析能力,標志著AI從數字世界向物理空間的滲透取得關鍵進展。
作為螞蟻集團AGI戰略的重要落地產品,靈光的研發團隊突破了多模態代碼生成、智能體協作等核心技術瓶頸。該產品已同步上線安卓與iOS平臺,其“讓復雜變簡單”的設計理念,正在重塑人機交互的底層邏輯。此前螞蟻集團已發布AI醫療管家、布局具身智能領域,此次靈光的推出,進一步驗證了其在通用人工智能領域從基礎研究到場景落地的完整能力鏈。















