WPS 灵犀

陈传林主导了全新 WPS 灵犀的设计,涉及 AI Agent、LUI + Canvas 等技术,WPS 灵犀 Copilot 已在 WPS PC 客户端运行。

WPS 灵犀封面

项目背景

2024 年在 Canvas 与通用 AI Agent 兴起的背景下,WPS 从“AI助手”形态转向 Agent + 办公套件深度绑定,据此立项 WPS 灵犀(WPS AI 3.0)。

wpsAiRibbon

洞察:WPS 用户怎么用 AI

  1. 意图入口分散,触达低,与任务心智不匹配

    用户找入口耗时、跳出率高;用户从“要做什么”到“去哪做”缺少直达路径,一个任务里的多枚 AI 意图被分散到不同入口,触达非常低。

  2. 用户偏好可编辑、带格式的中间产物

    一次成稿不如“结构正确、样式对齐、变量就位”的骨架更有用——便于快速完善与协作,显著降低返工成本。

  3. 创作是长过程,控制感优先于单次质量

    长文档/跨组件即长上下文多轮协作;需就地编辑、过程可视化与可溯源,才能稳住节奏与信心。

真正的 WPS AI 用户旅程

阶段启动生成编辑跨组件协作交付
行为打开 / 找入口发指令多次修改文档 ↔ PPT ↔ 表格预览 / 修正
痛点入口分散 / 路长一次生成不符 / 返工工具切换多 / 断流体验与格式不一致修正耗时 / 易错
机会点:灵犀介入(灵犀主站)
Chat+ 意图分发
(灵犀主站)
启发式中间产物
(灵犀 Copilot)
LUI 边聊边改
(灵犀 Copilot)
跨组件协作
(灵犀 Copilot 指令遵循)
样式保留 / 智能优化

体验目标

我们把“AI做得更快/更稳/更顺”的模糊期待,落成可被验证的体验目标:
  • 启动更轻。聚合五类高频意图为直达入口,提供起手式引导,缩短“想做什么→去哪做”的距离。
  • 生成更可控。在多数场景里,用户可以直接沿着“框架→细化”继续,而不是推翻重来
  • 编辑不中断。组件内 Copilot 在场协作,长上下文持久,过程可视化与可溯源,减少跨工具往返。

设计方案

我们将 AI 从“工具箱”重构为“生产线的两条路径”——主站负责从 0→1 的框架优先创作,组件内 Copilot 负责从 1→10 的在场协作。
由此,入口聚合让启动更轻;框架优先带来生成更可控;组件绑定保障编辑不中断。

灵犀主站改版

旧版灵犀首页的三个主要问题:
  1. 最近创作无法接力/转下一步
    只是“记录列表”,没有一键续写、转下一步或跨组件接力。
  2. 意图推荐不命中场景,教育价值低
    推荐与当前语境脱节,停留在泛化能力标签;场景不匹配、内容太泛;既不指导操作,也不建立心智。
  3. 巨幅 Banner 不承载任务
    占据首屏黄金位却不提供导航或操作;主任务让位于装饰,首屏效率被稀释。
lingxiOld
最初首页入口分散,后期收敛为 Chat + 核心意图分发。
  1. 单一起手
    只保留 Chat 作为默认入口,避免“去哪做”的选择成本。
  2. 意图卡片
    核心创作与文档解读被前置为卡片,减少选择成本,直达起手。
inputHomepage
inputPpT

灵犀Copilot

灵犀不是“另一个 Copilot”,而是深度绑定 WPS 套件的在场智能体:在场、懂上下文、可接力。
coverLingxi
copilotPpt
uiSidepane

灵犀 Inline AI

Inline AI 与 Copilot 的在场协作。
inlineInput
inlineMenu
inlineContext

迈向 AI Agent

为何要做 Agent?

  1. 通用/垂直 Agent 的缺口
    多数产品离真实文档创作仍有距离。WPS 的优势在于对创作链路的深度沉淀(公文规则、模板体系、版式与协作语义)。
  2. 对齐用户心智
    借助 Agent 的规划与信息搜集能力,让一次请求产出高质量、可编辑的成品,满足 WPS 早/晚期大众用户"拿来即用"的预期。

体验目标(两个核心):

  1. 高价值产出 + 劳动感知
    长过程研究不可避免 → 通过可观测过程提升“在为我工作”的感知,并交付高质量产物。
  2. 高成本请求的可控性
    一次请求代价大 → 设计不中断体验、分层容错与降级,保障任务稳态完成。
Agent Progress
Agent Result

一些值得关注的设计要点

起手式:AI输入框的设计。选取嗅探。上传文件。个性参数设定。
  1. 单一入口
    只保留一个输入框说“要做什么”;其它能力用「+」和技能按钮收纳(上传参考/意图切换/参数设定)。
  2. 选取嗅探
    支持“选区 / 文件 / 知识库”,并在输入框下方推荐问题,降低跑题概率。
inputStacks
过程的可视化。
大语言模型返回结果总是需要一些时间,利用等待阶段可视化“AI在做什么”(步骤/进度/耗时/可中断),让用户预判结果是否对路,降低焦虑,提升信任与可控感。
processStop
processStopText
processExpanded
结果对比、溯源。
让结果可核验、可比较、可回退:同时展示简要推理链与明确来源,便于自查真伪,降低幻觉风险,提升信任与可控感。
outputDebug
outputSource

结果

主站改版后,意图分流把用户从“纯 Chat”有效引到“创作/协作”路径——纯 Chat 占比由过往的高位(>70%)显著下降,创作类意图占比与有效结果采纳率同步提升,核心用户留存呈上行。

用户反馈中,用户多数认为新版的灵犀主站界面更简洁,各类功能更好找。总体评价较为正向。

WPS PC 端的灵犀 LUI 于 2025 年 7 月在上海世界人工智能大会发布,获得大会现场热烈反响和多个媒体报道。8 月当月日活用户实现接近 30W(全量曝光后,预计DAU将增长至300W)。

反思与未来

把 AI 放在生产线里,并不意味着“交给它就完了”。在生成质量上,我们仍看到模型带来的波动;为此我们在界面里加入“范例提示/意图分解”来降低输入歧义,和算法团队一起迭代。对新用户来说,“对话式编辑”是一种新心智,我们用渐进式引导建立信心。

展望下一步:让一致性变成可复用的设计体系(同入口、同语法、同反馈的规则库),把多模态输入(截图、选区嗅探,语音交互)接入 LUI;并把能力延展到会议、知识库等协作场景,让“不中断的生产”发生在更多地方。
试试用WPS灵犀进行创作
https://lingxi.wps.cn/

补充思考:面向泛化 AI Agent,架构与设计范式