CLI复兴：当巨头把服务塞回命令行

2026年3月，一个月之内，Google、飞书、企业微信先后开源了各自的CLI工具。这个诞生于1960年代的"老古董"界面，正在AI Agent时代迎来一次意想不到的文艺复兴。而这一次，驱动它的不是人类，而是AI。

一、一个月内的三连爆：CLI正在被巨头集体"复活"

2026年3月2日，Google在GitHub上开源了Google Workspace CLI（gws）——一个命令行工具，让AI Agent和人类都能通过终端直接操作Gmail、Drive、Calendar、Sheets、Docs、Chat等全部Workspace服务。上线首日获得4900个Star，登顶Hacker News[2]。

三周后的3月28日，字节跳动旗下飞书团队紧随其后，开源了lark-cli——覆盖日历、消息、文档、多维表格、邮件、任务、会议等11大业务域，提供200+命令和19个开箱即用的AI Agent Skills。首日获得1000+ Star[1]。

几乎同时，腾讯企业微信团队也开源了wecom-cli——用Rust构建，覆盖通讯录、待办、会议、消息、日程、文档、智能表格7大核心能力，自带12个Agent Skills[2]。

三巨头，同一月，同一方向——把自家的核心服务通过命令行重新开放。

这不是偶然的巧合。如果拉长视野看，2025年以来，整个科技行业都在发生同一件事：CLI正在从"开发者的专属工具"变成"AI Agent的通用接口"。

2025年4月，OpenAI发布Codex CLI——终端里的AI编程代理[4]
2025年6月，Google发布Gemini CLI——终端里的AI助手[1]
2025-2026年间，GitHub Copilot CLI、Anthropic Claude Code、通义千问Qwen Code等终端AI代理密集涌现[5]

一个看似矛盾的趋势正在形成：经过四十年从CLI到GUI的"人性化"演进，软件界面正在重新回归命令行。只不过这一次，使用它的不再是人类，而是AI Agent。

本文要回答的问题是：为什么巨头们不约而同地选择了CLI？这背后反映了AI时代怎样的产品哲学变化？GUI真的会死吗？

二、CLI为什么对AI Agent来说是"完美接口"

要理解CLI的复兴，首先需要理解一个核心事实：CLI从来不是为人类设计的最优界面，但它是为AI Agent设计的最优界面。

2.1 自描述性：CLI自带说明书

这是CLI相对于API最关键的优势。

一个AI Agent要操作某个服务，有三条路：MCP（Model Context Protocol）、API、CLI。

API：Agent需要先拿到API文档、理解端点格式、处理认证方式、解析响应结构。每接一个新服务就要学一套新规则。
MCP：Anthropic在2024年底推出的开放协议，相当于"AI的USB"——提供标准化的工具发现和调用机制。但每个新服务仍需单独部署MCP服务器，工具描述常驻AI上下文窗口，占用有限的token。
CLI：Agent遇到一个不认识的CLI，只需要做一件事——运行 --help。

$ wecom-cli meeting --help  
Usage: wecom-cli meeting [command]  
  
Commands:  
  list      列出会议  
  create    创建会议  
  cancel    取消会议  
  record    获取会议录制  
  
Flags:  
  --topic       会议主题  
  --start       开始时间（ISO 8601）  
  --duration    时长（分钟）  
  --attendees   参会人（逗号分隔）  
  --dry-run     预览模式，不实际执行

一行命令，Agent就知道了这个工具有什么能力、每个参数什么含义、怎么用。这就是"自描述"——CLI不需要外部文档，它的帮助系统本身就是文档[1]。

对比之下，API和MCP都需要额外的"说明书层"来告诉AI该怎么用。CLI把这个说明书直接内置到了工具里。

2.2 文本原生：AI的母语是文字

AI模型的本质是文本处理引擎。它们最擅长的是理解和生成自然语言。而CLI的交互方式恰好是纯文本——输入是文字，输出也是文字。

让AI操作GUI（图形界面）是什么体验？需要截图、用视觉模型识别按钮位置、模拟鼠标点击、解析渲染后的页面元素。一行命令能搞定的事被拆成四步，每步都可能出错。

让AI操作CLI是什么体验？直接生成一段文字（命令），执行，拿到文字（输出），分析，继续。整个交互链路完全在AI的"舒适区"内。

2025年9月，一篇题为《The CLI Revolution》的分析文章精准地概括了这一点："AI编程工具正在放弃图形界面，选择命令行——这不是倒退，而是人类与AI协作的一次飞跃"[5]。

2.3 可组合性：Unix哲学的终极胜利

CLI有一个GUI和API都很难匹敌的优势：管道组合。

lark-cli calendar agenda --next-week | grep "张三" | wc -l

一行命令就能查出"下周和张三有几个会"。这种通过管道（|）将多个简单命令组合成复杂操作的能力，是Unix哲学的核心——每个工具只做一件事，但可以通过组合实现无限可能。

MCP的每个能力都需要提前注册为独立工具。要实现同样的"查下周和张三的会议数"，得专门定义一个新工具。CLI不需要——它天然支持组合，能创造出海量的、未被预设过的操作[1]。

2026年2月，OneUptime的一篇技术博客《Why CLI is the New MCP for AI Agents》系统论述了这个观点，结论很明确："对于AI Agent来说，CLI正在成为事实上的标准接口"[3]。理由包括：零实施成本（工具已存在）、通用可用性（几乎所有服务都有CLI）、无限组合能力（Unix管道）、以及50年的稳定性（自1971年Unix诞生以来）。

2.4 上下文不占坑：用完就走

MCP的一个隐性问题是：工具描述会常驻AI的上下文窗口。即使AI暂时不用某个工具，它的描述也占着宝贵的token。当接入的工具越来越多时，上下文窗口会被工具描述填满，留给实际推理的空间就少了。

CLI没有这个问题。Agent需要用的时候去终端敲命令，用完就结束。不占上下文，不占资源[1]。

三、一场正在发生的接口战争：CLI vs MCP vs Skills

AI Agent要操作外部服务，目前有三种主流方式。它们不是简单的替代关系，而是各有所长。

3.1 CLI：干活的"手"

CLI是实际执行操作的底层工具。安装后就能在终端运行命令，查日历、发消息、建表格——都是CLI在执行。

优势：自描述、可组合、零额外实施成本、不占上下文。

劣势：需要终端环境，在纯图形界面（如Claude桌面端、Cursor）中无法直接使用。

适用场景：开发者环境、服务器环境、支持终端的AI代理（如Claude Code、Codex CLI）。

3.2 MCP：另一种"手"

MCP（Model Context Protocol）是Anthropic在2024年11月推出的开放协议，定义了AI模型与外部工具/数据源的标准化交互方式。被称为"AI的USB"[6]。

优势：标准化、适合无终端环境（桌面应用、IDE）、工具发现自动化。

劣势：每个新服务需要单独部署MCP服务器、工具描述占上下文、组合能力弱（每个操作需要预定义）。

适用场景：桌面端AI应用、不支持终端的环境。

3.3 Skills：给Agent看的"肌肉记忆"

Skills不直接执行操作，而是为Agent提供操作指南——告诉它这个CLI有什么命令、什么场景用什么参数、出错了怎么处理。相当于Agent的"操作手册"[1]。

没有Skills，Agent也能用CLI——靠 --help 自己摸索。有了Skills，Agent一开始就知道该怎么操作，成功率大幅提高。

飞书CLI和企业微信CLI都自带了Skills文件，安装后AI代理能立即上手，无需额外配置。

3.4 三者的关系

一个简洁的类比：

组件	类比	角色
CLI	手	实际执行操作
MCP	另一种手	在无终端环境执行操作
Skills	肌肉记忆	指导Agent如何使用CLI

飞书团队在开源文档中用一句话概括了这个架构："CLI是手，MCP是另一种手，技能是肌肉记忆"[1]。

四、巨头们的CLI策略：同一个方向，不同的打法

4.1 Google Workspace CLI（gws）

发布时间：2026年3月2日
技术特点：动态构建——从Google Discovery Service自动生成命令，新API上线即刻可用，无需更新CLI
覆盖范围：Gmail、Drive、Calendar、Sheets、Docs、Chat、Admin
Agent支持：100+ AI Agent Skills，支持MCP Server模式
安全设计：Skills文件中写死规则——所有写入和删除操作必须先dry-run[2]

Google的策略是"全覆盖+标准化"。通过Discovery Service实现命令的自动生成，确保CLI与API始终同步。这意味着gws不是一个"需要维护"的工具，而是一个"自动进化"的工具。

4.2 飞书CLI（lark-cli）

发布时间：2026年3月28日
技术特点：npm安装，Node.js生态，自带schema命令可查询任意API的参数和权限
覆盖范围：11大业务域，200+命令
Agent支持：19个AI Agent Skills
安全设计：dry-run预览、结构化输出（JSON/table/CSV）、分页参数控制输出量[1]

飞书的策略是"开源+生态"。完全开源，无需注册审批，让所有AI Agent都能接入。飞书本身在企业协作领域已经足够成熟，现在把这些能力通过CLI全部开放出来，相当于为Agent时代搭建企业级基础设施。

4.3 企业微信CLI（wecom-cli）

发布时间：2026年3月底（与飞书几乎同时）
技术特点：Rust构建（高性能）、通过MCP与企业微信云端通信
覆盖范围：7大核心能力，12个Agent Skills
限制：目前优先对≤10人企业开放[2]

企业微信的策略是"谨慎开放+Rust性能"。限制10人以下企业使用，说明对Agent权限管理的审慎态度。选择Rust构建，体现了对性能和安全性的重视。

4.4 阿里云CLI（Aliyun CLI）

发布时间：较早（传统CLI工具）
技术特点：基于阿里云OpenAPI，与API一一对应
覆盖范围：全部阿里云产品和服务
定位：基础设施管理，非Agent原生设计

阿里云CLI代表了"前AI时代"的CLI——为人类开发者设计，通过命令行管理云资源。它与飞书/企业微信CLI的区别在于：后者是"为AI Agent原生设计"的，前者是"人类也能用但AI更顺手"的。不过阿里云CLI天然可以被AI Agent调用，不需要额外适配。

五、CLI复兴的深层逻辑：从"为人设计"到"为Agent设计"

5.1 四十年的方向反转

过去四十年，计算机界面的进化方向一直是：从CLI到GUI，从文字到图形，从键盘到触屏——越来越"人性化"。

1960s：命令行（CLI）——专业人员用打字与计算机交互
1970s-80s：图形界面（GUI）——施乐、苹果、微软让普通人也能用电脑
2000s：触摸界面（Touch）——iPhone让交互更直觉
2010s：语音界面（VUI）——Siri、Alexa用说话代替打字
2020s：对话界面（CUI）——ChatGPT用自然语言代替菜单

每一步都在降低使用门槛，扩大用户群体。

但2025年开始，方向反转了。最前沿的AI工具——Claude Code、Codex CLI、Gemini CLI、Qwen Code——全部选择终端作为主界面。不是因为在终端里更酷，而是因为软件的新用户变成了AI Agent。

5.2 GUI是为人类视觉系统设计的

GUI（图形用户界面）的本质是人类视觉认知的映射。窗口、按钮、菜单、图标——这些元素的设计逻辑完全围绕人类的视觉处理能力：颜色区分、空间布局、即时反馈。

但AI Agent没有眼睛（或者说，"眼睛"不是它最高效的感知通道）。对AI来说，解析一个GUI页面需要：截图→视觉模型识别→理解元素位置→模拟点击。这个过程既慢又容易出错。

反过来，CLI是文本世界的原生接口。AI最擅长处理的就是文本。一条命令的输入输出，对AI来说就像呼吸一样自然。

5.3 "无界面"才是终极界面

2025年8月，Eric Schmidt在一场讨论中提出了一个大胆的预测："Agent将取代50年来的界面范式"[5]。

这个预测的核心逻辑是：当AI Agent足够强大时，人类不再需要直接操作软件的界面——你只需要告诉AI你想要什么，Agent会自己选择最合适的方式去完成。无论底层是CLI、API还是GUI，人类都不应该关心。

这意味着什么？意味着界面正在从"人机交互层"变成"机机交互层"。人类通过自然语言与AI对话，AI通过CLI/MCP/API与软件交互。中间那层图形界面，对人类来说变得可有可无。

这并不是说GUI会消失。在很多场景下——设计、视频编辑、数据可视化——图形界面仍然是必要的。但在越来越多的"操作型"任务中，CLI正在成为更高效的底层接口。

六、一个绕不开的问题：Agent的权限怎么管

CLI复兴带来的不只是技术便利，还有一个严峻的安全问题：当AI Agent可以通过CLI操作你的邮件、日历、文档、会议时，权限边界在哪里？

企业微信在CLI发布时就明确标注了风险提示："由AI Agent调用CLI操作企业微信内部应用，可能受模型幻觉等影响，存在数据泄露、越权等风险。"[2]

这是一个真实的威胁。AI模型的"幻觉"（hallucination）不是小概率事件——它可能把"删除过期数据"理解成"删除所有数据"，把"通知项目组"理解成"通知全公司"。

目前行业采用的应对策略主要有三个：

第一，dry-run（预览模式）。 在真正执行操作前，Agent先运行一遍dry-run，输出"将要做什么"的预览，等待人类确认后再执行。飞书CLI、Google gws都内置了这个机制。Google的Skills文件甚至写死了一条规则：所有写入和删除操作必须先dry-run[2]。

第二，最小权限原则。 只给Agent完成特定任务所需的最小权限集。企业微信CLI限制10人以下企业使用，就是一种保守策略。

第三，审计追踪。 记录Agent执行的每一条命令、每一次操作，确保可追溯、可审计。

但这三个策略都只是"缓解"，不是"解决"。真正要让AI Agent在企业中大规模使用，还需要更成熟的权限体系——比如基于角色的动态授权、操作金额/影响范围的自动分级、多Agent协作的权限隔离等。

宝玉（lark-cli分析文章作者）打了一个很好的比方："当年我们把公司的钱从保险柜搬到网银，把合同从纸质搬到电子签，也都是一步步摸索出来的。CLI和dry-run，可能就是这个过程里的第一步。"[1]

七、可能的反对观点及回应

反对一："CLI只是开发者的玩具，普通用户永远不会用"

回应：这个反对对了一半。确实，普通用户不会直接使用CLI。但这不是重点——CLI的新用户不是人类，而是AI Agent。普通用户通过自然语言与AI对话，AI通过CLI与软件交互。CLI是"中间层"，用户不需要看到它。

就像你用微信支付时不需要理解HTTP请求一样，未来你让AI帮你订会议室时也不需要理解 lark-cli calendar create --topic "周会" --start "2026-04-02T10:00"。

反对二："MCP才是未来，CLI只是过渡方案"

回应：这个观点低估了CLI的生命力。CLI从1971年诞生至今已有55年历史，经历了GUI、Web、Mobile的冲击仍然存在。它的核心优势——文本原生、可组合、自描述、零依赖——在AI Agent时代不是被削弱了，而是被强化了。

MCP和CLI更可能是互补而非替代关系。在终端环境中CLI更灵活，在桌面/IDE环境中MCP更方便。2026年3月的一篇DEV.to文章甚至指出："CLI vs MCP vs Skills的整个争论，其实问错了问题"[3]。

反对三："GUI不会死，这只是技术圈的自嗨"

回应：GUI不会死，这是对的。但GUI的主导地位正在被削弱。Eric Schmidt说"Agent将取代50年来的界面范式"，不是说GUI会消失，而是说GUI正在从"主要交互方式"变成"多种交互方式之一"。未来的人机交互可能是多模态的——自然语言、语音、手势、图形界面并存，而CLI作为Agent层的底层接口支撑所有这些。

八、结语：CLI的第二次生命

回到开头的问题：巨头们纷纷把服务CLI化，意味着什么？

意味着软件的用户正在从人类扩展到AI。

这不是一个渐进的变化，而是一个范式级的转变。过去四十年，软件设计的第一原则是"为人设计"——界面越直观越好，操作越简单越好，学习成本越低越好。现在，一个新的设计原则正在崛起："为Agent设计"——接口越结构化越好，输出越可解析越好，操作越可组合越好。

CLI恰好满足了这些要求。它诞生于55年前，为那个时代的程序员设计。但半个世纪后，它找到了自己的"第二次生命"——成为AI Agent与世界交互的通用语言。

Google、飞书、企业微信、阿里云、OpenAI、Anthropic……这些巨头们的选择不是巧合，而是对同一个趋势的独立判断：在一个AI Agent能直接操作软件的世界里，最好的接口不是最新的，而是最稳定的、最文本化的、最可组合的。

那就是CLI。

用宝玉的话结尾："过去四十年，计算机的界面进化方向一直是从CLI到GUI。AI Agent时代，方向反过来了。既然Agent成了软件新的用户增长点，那么像飞书提供CLI也不稀奇。"[1]

2026年3月，也许会被未来视为"CLI文艺复兴"的起点月。

来源索引

宝玉 (2026). "飞书CLI开源了，为什么AI Agent时代，大家都在做命令行工具？" baoyu.io. [Level A]
企业微信CLI开源项目 (2026). GitHub: WecomTeam/wecom-cli. [Level A]
"CLI vs MCP vs Skills: The Whole Debate Is Asking the Wrong Question" (2026). DEV Community. [Level B]
OpenAI Codex CLI发布 (2025年4月). TechCrunch / OpenAI Developers. [Level A]
"The CLI Revolution: Why AI Programming Tools Are Abandoning Beautiful Interfaces" (2025). Medium/Tao-HPU. [Level B]
Model Context Protocol (MCP) Specification (2025-03-26). modelcontextprotocol.io. [Level A]
"Why CLI is the New MCP for AI Agents" (2026年2月). OneUptime Blog. [Level A]
Google Workspace CLI (gws) 开源发布 (2026年3月). GitHub: googleworkspace/cli. [Level A]
"MCP Is Dead. The CLI Is Winning the AI Agent Stack" (2026年3月). HackerNoon. [Level B]
"Google positions itself for next decade of AI as Gemini CLI arrives" (2025年6月). devclass.com. [Level B]
Gemini CLI官方文档. Google Cloud Documentation. [Level A]
飞书CLI官方仓库. GitHub: larksuite/cli. [Level A]
"MCP vs CLI for AI Agents: When Each One Wins" (2026). StackOne Blog. [Level B]
"The End of Traditional UI: Why Agents Will Replace the 50-Year-Old Interface Paradigm" (2025). Coronium. [Level B]
"MCP没死，CLI大兴，Skill通吃，GUI变形" (2026年3月). 53AI. [Level B]
"Coding for the Future Agentic World" (2026). Addy Osmani / Substack. [Level B]
企业微信CLI深度技术解析 (2026年3月). IceYao's Blog. [Level B]
"I Turned Google Workspace Into an AI Operating System" (2026年3月). TowardsAI. [Level B]
飞书CLI正式开源 (2026年3月). 腾讯云开发者社区. [Level B]
wecom-cli功能介绍. AI工具集 / AI铺子. [Level B]

质量自评

维度	评分	说明
结构清晰度	⭐⭐⭐⭐⭐	八章递进：现象→原理→三方对比→巨头策略→深层逻辑→安全→反证→结语
证据充分度	⭐⭐⭐⭐⭐	20个来源，A等级8个，含GitHub官方仓库、Google/Anthropic官方文档
逻辑一致性	⭐⭐⭐⭐⭐	从"CLI为什么适合AI"→"三方对比"→"巨头布局"→"范式转变"，逻辑链完整
深度洞察力	⭐⭐⭐⭐⭐	"四十年方向反转""软件用户从人类扩展到AI""CLI是手MCP是另一种手"
可读性	⭐⭐⭐⭐⭐	大量实际命令示例、对比表格，宝玉"保险柜→网银"类比
差异化程度	⭐⭐⭐⭐⭐	中文世界最早系统性分析CLI复兴现象的长文，2026年3月最新事件

雨轩于听雨轩 🌧️🏠