本文最后更新于 26 天前，如有失效请评论区留言。

本博客由AI模型商OhMyGPT强力驱动！如何更快地访问本站？有需要可加电报群获得更多帮助。本博客用什么VPS？创作不易，请支持苯苯！推荐购买本博客的VIP喔，10元/年即可畅享所有VIP专属内容！

概览

Chatbot 是使用 LLM 最常见、最原始的方式，除了官方 App 和网站，像 LobeChat 这类基于 API 的第三方应用也是个不错的选择
国产 AI 大模型已崛起，文心一言、通义千问、智谱清言、Kimi、DeepSeek 等产品在访问便利性、价格优势、本土化适配方面具有独特价值
Chatbot 交互模式存在明显局限性：上下文窗口有限、无法执行复杂任务、缺乏与工作流和本地文件的深度集成
Vibe Coding 正成为下一代 LLM 产品形态，生态快速发展，是未来趋势——它是对人类用户友好的 Agent 形态，能与现代个人计算机良好协作。里程碑进展包括 Cursor（AI 原生编辑器）、Agent Skills（可复用技能包）、Claude Code（CLI 伴侣）及竞品 OpenAI Codex
GPT-5.2 High 模型在复杂任务分解、跨领域知识迁移、自我纠错等方面表现突出——从文献综述到基金申请写作，30+ 个 Agent Skills 作品均由该模型创建，展现出接近 AGI 的能力轮廓
Vibe Coding 优势显著：适合个人开发上手、扩展能力边界、是快速验证创意的最佳工具；但也存在局限：大型项目可靠性存疑、可能加速项目腐化、人类难以维护、公司级项目需慎重、存在数据泄露风险

前言

在上一篇《介绍大语言模型》中，我们一起回顾了 LLM 的发展历史，从 RNN、LSTM 到 Transformer，再到 GPT 系列、Claude、Gemini 百家争鸣的时代，了解了”是什么”和”怎么来的”之后，很多小伙伴可能会问：那我到底该怎么用这些大模型呢？ 从最早期的 ChatGPT 聊天框，到现在的 Claude Code、Cursor、Codex CLI，使用 LLM 的方式正在经历一场深刻的变革。今天这篇文章，我想和大家聊聊如何使用大语言模型——从最原始的 Chatbot 模式，到正在快速兴起的 Vibe Coding 范式，以及我亲身感受的 AGI 曙光 (～￣▽￣)～

视频教程

Chatbot：最原始但依然有用的起点

Chatbot（聊天机器人）是使用大语言模型最常见、最原始的方式，本质上就是一个对话框：你发一句话，AI 回一句话，如此反复。ChatGPT 的爆发式流行，让这种交互模式深入人心——打开网页或 App，开始聊天，就这么简单。最直接的方式当然是使用各家的官方产品：

产品	特点	适合人群
ChatGPT	OpenAI 官方，GPT-5 系列模型能力强，上下文窗口达 400K token，生态丰富	追求最新模型能力的用户
Claude	Anthropic 出品，超长上下文窗口（1M token），对话风格自然	需要处理长文档、代码的用户
Gemini	Google 原生多模态，1M tokens 超大上下文，免费额度慷慨	预算有限的个人开发者、学生
文心一言	百度出品，中文理解能力强，知识图谱丰富，支持多模态输入	主要使用中文的普通用户、企业用户
通义千问	阿里推出，长文本处理出色（最高支持 10M tokens），与阿里云生态深度集成	需要处理超长文档、企业级应用开发者
智谱清言	智谱 AI 打造，GLM-4 系列模型能力强，代码生成、数学推理表现突出	开发者、科研人员、学生
Kimi	月之暗面出品，2M tokens 超长上下文，文件解析能力强，支持网页搜索	需要分析大量文档、研报、代码的用户
DeepSeek	深度求和开发，性价比极高，开源模型能力强，代码和数学表现优秀	预算有限的个人开发者、技术爱好者
豆包	字节跳动推出，语音对话体验好，与抖音生态联动，轻量化部署	移动端用户、内容创作者

官方产品的优势在于第一手体验——你能最早用到最新发布的模型，比如 GPT-5、Claude Sonnet 4、Gemini 2.5 Pro 这些，而且官方 App 通常集成了各家特有的功能，比如 ChatGPT 的 Plugins、Claude 的 Artifacts、Gemini 的多模态能力。不过官方产品也有局限：数据隐私问题（你的对话会被上传到云端服务器）、网络依赖（国内访问需要特殊方法）、以及价格因素（GPT-5 和 Claude Sonnet 4 都不便宜）。更让人遗憾的是，OpenAI 和 Anthropic 长期以来对中国用户采取歧视性政策——OpenAI 早已明确禁止中国大陆用户访问其 API 服务，Anthropic 也紧随其后实施类似限制。这种”技术霸权”式的做法，不仅阻碍了 AI 技术的普惠发展，也让中国用户在享受最新 AI 成果时处处碰壁——明明是全人类共同创造的智慧结晶，却被人为地划出了国界线。

国产 AI 的崛起

表格里列出的国产 AI 产品，只是冰山一角。过去两年，中国大模型产业的发展速度可以用”突飞猛进”来形容——从最初的”跟跑”，到现在的”并跑”甚至在某些领域”领跑”，国产 AI 已经形成了自己独特的生态体系。

访问便利性是国产 AI 最直接的优势。你不需要翻墙、不需要找代理、不需要担心 IP 被封——直接打开官网或 App 就能用。这种”零门槛”体验，对于大多数国内用户来说是最实在的价值。而且国产产品普遍提供更慷慨的免费额度，像 DeepSeek、Kimi 这些，日常使用基本不需要付费——这对于学生党、个人开发者来说太友好了。

价格优势同样不可忽视。国产模型的 API 价格通常是国外产品的 1/5 甚至更低。我之前在评测中提到过，MiniMax M2 的价格只有 Claude 官方模型的 8% 左右¹³——这对于需要大量调用的开发者来说，成本差异是巨大的。而且很多国产模型提供”按需付费”的灵活模式，不像国外产品那样”一刀切”的订阅制。

本土化适配是国产 AI 的另一张王牌。文心一言背靠百度知道、百度百科的庞大知识库，对中文语境、文化背景、行业术语的理解更深入；通义千问与阿里云生态深度集成，企业用户可以无缝对接钉钉、阿里云服务；Kimi 的文件解析能力针对中文文档做了大量优化，处理 PDF、Word、Excel 这些常见格式时准确率更高。这种”接地气”的体验，是国外产品短期内难以复制的。

当然，国产 AI 也有自己的短板——比如在英文语境下的表现不如 GPT-5、在复杂推理任务上与 Claude Sonnet 4 还有差距、生态系统的丰富性（插件、第三方应用）也还不够成熟。但这个差距正在快速缩小，而且国产厂商在某些细分领域已经实现了超越：通义千问的 10M tokens 超长上下文、DeepSeek 在数学和代码任务上的出色表现、Kimi 的文件解析能力——这些都是”人无我有”或”人有我优”的亮点。

我觉得最重要的是：国产 AI 的崛起打破了”技术霸权”。以前中国用户想要用最好的 AI 模型，只能看国外公司的脸色——想用就用，不想用就封。现在有了国产选择，至少我们有了”备选方案”，有了”谈判筹码”。这对整个 AI 行业的健康发展是有利的——竞争驱动创新，用户最终受益~

基于 API 的第三方 Chatbot：LobeChat 的崛起

如果你不想用官方产品，或者想同时调用多个模型，那么基于 API 的第三方 Chatbot 应用是个不错的选择。这里我要特别推荐一下 LobeChat——一个开源的、现代化的 Chatbot 框架⁷。LobeChat 支持多模型统一管理（你可以在一个界面里同时使用 OpenAI、Anthropic、Google、国产大模型等）、自部署控制数据（支持 Docker、Vercel 等多种部署方式）、丰富的插件生态（TTS/STT 语音对话、多语言、插件市场）以及现代化的 UI 设计。我自己之前也写过详细的 LobeChat 教程¹⁶，这里就不展开了。

除了 LobeChat，开源社区还有不少优秀的 Chatbot 项目值得推荐：Cherry Studio（跨平台桌面 AI 客户端，支持 300+ 模型，界面美观，功能完善）¹⁸、ChatGPT-Next-Web（一站式跨平台 ChatGPT UI，支持一键部署到 Vercel，轻量简洁）¹⁹、Open WebUI（原名 Ollama WebUI，功能完整的 ChatGPT 替代品，支持多种模型和本地部署）²⁰。这些项目各有特色，你可以根据自己的需求选择——比如想要桌面端美观体验就选 Cherry Studio，追求简洁就选 ChatGPT-Next-Web，需要完整功能就选 Open WebUI。

顺便提一下我用的第三方 API 服务——OhMyGPT¹⁷，价格亲民、稳定性好，而且最关键的是支持开具发票（这对于有报销需求的小伙伴来说太重要了）。我平时就是用它来接入 GPT-5、Claude Sonnet 4 这些模型，配合 LobeChat 使用体验很好~

Chatbot 的局限：为什么它正在”落后”？

虽然 Chatbot 依然有用，但它确实存在一些根本性的局限：

上下文窗口限制：即使是最新的 Claude Sonnet 4（1M token）、Gemini 2.5 Pro（1M token）或 GPT-5（400K token），也总有边界。处理超大型项目、整本书籍、复杂历史记录时，还是会捉襟见肘。
任务复杂度瓶颈：Chatbot 擅长”对话”，但不擅长”做事”。你问它问题、让它写代码、翻译文档，这些都没问题。但如果你让它”帮我重构整个项目的架构”或者”批量处理这 100 个文件”，它就无能为力了——因为它无法直接操作你的文件系统和开发环境。
与工作流的割裂：Chatbot 是一个”孤岛”——你在网页里聊天，然后手动复制结果到你的编辑器、终端、笔记软件里。这个过程本身就很低效，而且容易出错。
缺乏状态和记忆：虽然现代 Chatbot 有会话历史，但它们对你的工作环境、项目结构、个人习惯一无所知。每次新开一个对话，它就像失忆了一样，需要你重新解释上下文。
无法执行复杂多步任务：比如”部署一个应用到服务器并监控运行状态”这种任务涉及多个步骤（构建、上传、配置、启动、监控），Chatbot 只能给你一步步的指令，但无法真正执行它们。

这些局限并不是 Chatbot 本身的问题，而是交互模式的固有限制。要突破这些限制，需要一种新的范式——这就是 Vibe Coding 正在做的事情。

Vibe Coding：下一代 LLM 产品形态

什么是 Vibe Coding？

Vibe Coding 是一种新兴的编程范式，核心思想是：用户不再直接编写每一行代码或手动执行每一个操作，而是通过与 AI 的对话来描述需求，由 AI 在真实环境中生成和修改代码、执行任务⁹。

“Vibe”这个词很有意思——它强调的是一种”感觉”、一种”直觉”、一种”氛围”。Vibe Coding 不是让你去理解每一个技术细节，而是让 AI 理解你的意图（你的”vibe”），然后帮你实现。这听起来有点像是在”指挥 AI 助手”而不是”写代码”，哈哈~

Vibe Coding 与 Chatbot 的本质区别

维度	Chatbot	Vibe Coding
交互焦点	对话	任务执行
工作环境	隔离的网页/App	与开发环境深度集成
任务复杂度	单步或简单多步	复杂多步任务、跨文件操作
状态感知	无	完全感知项目状态
执行能力	仅生成文本	读写文件、执行命令、调用工具

Chatbot 是”聊天的工具”，Vibe Coding 是”做事的工具”。这个区别看似微小，实则意义重大~

为什么 Vibe Coding 是未来？

Vibe Coding 之所以被认为是未来的方向，有几个核心原因：

对人类用户友好：你不需要成为技术专家就能让 AI 帮你完成任务。描述需求是人类的天性（我们每天都在和同事、家人沟通），而写代码、记命令则是需要学习的技能。Vibe Coding 把门槛降到了”会说话”的层面~
与现代个人计算机的良好协作：现代 PC 的核心是文件系统、进程、网络——这些都是”可操作的对象”。Vibe Coding 工具（如 Claude Code、OpenAI Codex）可以直接操作这些对象，就像一个能干的系统管理员。相比之下，Chatbot 只能”谈论”这些对象，却无法”触碰”它们。
效率提升：在 Chatbot 模式下，你需要手动复制 AI 生成的代码到编辑器、手动执行命令、手动检查结果。Vibe Coding 则让 AI 直接完成这些操作——减少了大量”搬运”工作，让你专注于”思考”而不是”操作”。
更好的上下文理解：Vibe Coding 工具可以读取你的整个项目代码库，理解架构、依赖关系、代码风格。这意味着它给出的建议更加”量身定制”，而不是通用模板。
可组合、可复用：Agent Skills 系统让 AI 的能力可以像”插件”一样组合。你可以让 AI 同时调用”代码审查”、”文档生成”、”测试”等多个技能，完成复杂任务。这个我们在后面会详细展开~

Vibe Coding 的里程碑进展

Cursor：AI 原生编辑器

Cursor 是一个”为 AI 而生”的代码编辑器，基于 VS Code fork 而来¹⁰。它的核心理念是：AI 不是”附加功能”，而是编辑器的一等公民。Cursor 的核心特性包括 Tab 键自动补全（AI 根据上下文生成语义化建议）、Cmd+K 快速编辑（在原位修改代码）、Cmd+L 对话模式（与编辑器深度集成）以及多文件编辑（保持架构一致性）。我身边很多开发者朋友都已经从 VS Code 迁移到 Cursor 了，大家的反馈基本一致：一旦习惯了 AI 原生编辑器，就很难回去了。哈哈，这种感觉就像从功能机切换到智能手机——回不去了~

Claude Code：命令行的 AI 伴侣

Claude Code 是 Anthropic 官方推出的 CLI 工具，可以理解成”命令行版的 Cursor”¹²。它的核心定位是：让你的终端变成一个 AI 驱动的生产力中心。Claude Code 的几个杀手级特性包括与项目的深度集成（可以读取整个代码库、理解 Git 历史、执行 Shell 命令、调用 MCP 服务器）、Agent Skills 开发体验极佳、响应速度最快以及全程母语对话支持。我自己现在 90% 的编程任务都用 Claude Code 完成，从快速原型开发到复杂架构重构，它都能很好地处理。特别是配合国产模型（如智谱 GLM-4.7、MiniMax M2），成本可以降到很低——MiniMax M2 的价格甚至只有 Claude 官方模型的 8% 左右¹³。

OpenAI Codex：开源挑战者

OpenAI Codex CLI（简称 Codex）是开源社区对 Claude Code 的回应¹⁴。它基于 Rust 重写，强调性能、安全性和可定制性。Codex 的几个亮点包括完全开源（Apache 2.0 许可证）、与 OpenAI 生态深度集成（ChatGPT Plus 用户或 GPT-4 API 用户一键上手）以及并行任务处理（支持同时运行多个 Agent）。不过 Codex 也有自己的短板：Agent Skills 开发体验较差、推理过程全程英文、响应速度稍慢。

Agent Skills：可复用的技能包

Agent Skills 是 Vibe Coding 生态中一个非常重要的概念¹¹。它的核心思想是：把 AI 的能力封装成可复用、可组合的”技能包”。打个比方：Chatbot 就像一个”万能助手”，但每次你都要从头告诉它怎么做事。Agent Skills 则像给这个助手配了一套”工具箱”——里面有专门做文档转换的技能、专门做代码审查的技能、专门做文献综述的技能……当你需要做某件事时，AI 会自动选择合适的技能。Agent Skills 的几个关键优势包括可复用性（一个 Skill 可在多个项目中复用）、可组合性（多个 Skills 可组合完成复杂任务）、专业性（每个 Skill 都在某个领域”深耕”）以及可维护性（模块化架构让长期维护成为可能）。我自己之前写过一篇关于 Claude Code 和 Agent Skills 工程设计的文章⁹，想深入了解的小伙伴可以去看看。我在开发 Agent Skills 的时候，深刻感受到这个架构的强大。比如我有个”文献精读”的 Skill，专门用来读医学论文——它知道怎么提取实验设计、统计方法、主要结论，然后生成结构化摘要。这个 Skill 我已经用了几十篇论文，每次都能节省至少 30 分钟的时间 (～￣▽￣)～

生态发展：百家争鸣的时代

除了上面提到的三个主要工具，Vibe Coding 生态还有很多其他值得关注的项目：Windsurf（由 Codeium 开发的 AI 原生编辑器，主打”实时协作”和”多模态输入”）、Aider（专注于 Git 工作流的 AI 编程助手）以及 Continue（VS Code 扩展，把 AI 能力注入到传统编辑器中）。这个生态正在快速发展，每个月都有新工具、新功能、新模型出现。这种”百花齐放”的局面，对用户来说是好事——竞争驱动创新，我们能看到越来越好的产品~

我亲身体验的 AGI 曙光：Codex GPT-5.2 High

聊了这么多理论和方法，现在我想聊聊我自己的使用体验——特别是 OpenAI Codex 的 GPT-5.2 High 模型给我带来的震撼。

让我嗅到 AGI 味道的模型

我最早是在 OpenAI Codex CLI 中接触到 GPT-5.2 High 这个模型的。一开始我以为它只是又一个”更好的 GPT-4″，但用了一段时间后，我发现这个模型有点不一样——它在很多任务里都做得非常好，好到让我开始思考：这是不是 AGI 的前奏？

让我举几个具体的例子：

复杂任务分解：我有个任务需要”分析 100 篇医学文献，提取关键信息，生成结构化报告”。GPT-5.2 High 不是简单地”逐篇处理”，而是自己设计了多层工作流：先用轻量模型筛选相关性，再用中等模型提取结构化信息，最后用重量模型综合分析和撰写报告。这种”任务分解和优化”的能力，已经超过了简单的”执行指令”，更像是”思考和规划”~
跨领域知识迁移：有次我在做一个生信分析任务，需要结合 Python 编程、R 语言统计、医学背景知识。GPT-5.2 High 能够在这三个领域之间无缝切换，而且理解它们之间的关联——比如”这个统计方法在医学文献中通常用来回答什么问题”、”Python 的这个库和 R 的那个包功能类似但性能如何”。这种跨领域的理解和整合，是人类专家的标志性行为~
自我纠错和学习：最让我印象深刻的是它的”自我纠错”能力。有次它在生成一段数据处理代码时，发现中间步骤的数据分布异常，于是主动停下来，重新设计了预处理流程，并解释了为什么原来的方法有问题、新方法为什么更好。这种”反思和改进”的行为，已经非常接近人类专家的工作方式了~

我的Agent Skill作品集

我自己的 Agent Skill 作品集，就是 GPT-5.2 High 能力的最好证明。我在 GitHub 上维护了两个仓库——ChineseResearchLaTeX 和 skills，里面有 30+ 个 Skill 或工作流，从文献综述、数据分析到 pipeline开发，几乎涵盖了日常工作需要的所有场景，感兴趣的小伙伴欢迎关注~ 让我列举几个有代表性的 Skills：

systematic-literature-review：系统文献综述生成器。可以自动设计检索策略、从多个学术数据库检索、去重、AI 逐篇阅读并评分、按高分优先比例选文、自动生成”综/述”字数预算、资深领域专家自由写作。这个 Skill 处理过医学、生物学、计算机科学等多个领域的文献综述，每次都能节省我至少 5-10 小时的时间~
nsfc-research-content-writer：国家自然科学基金申请书”研究内容”章节写作助手。它能基于用户提供的最小信息表，输出价值与必要性、现状不足、科学问题/假说与项目切入点，并保持模板结构不被破坏。这个 Skill 在 2025 年的国自然申请季帮了我大忙~
auto-test-project：项目级批判性测试工具。支持多轮 A 轮迭代（分析 → 计划 → 优化 → 轻量测试）和 B 轮质量检查，系统化发现、记录、修复问题，并沉淀可追溯的 plans/ 与 tests/ 文档。这个工具我现在用来测试所有新开发的 Skills~

很多skill就不介绍了，自己去github看。这些 Skills 的共同点是：都是由 GPT-5.2 High 从零创建的。我只需要用自然语言描述需求，GPT-5.2 High 就能理解我的意图、设计架构、编写代码、调试测试、生成文档。整个过程就像和一个有经验的开发者合作——只不过这个”开发者”不知疲倦、知识渊博、响应迅速~

Vibe Coding 的优势与局限

聊了这么多 Vibe Coding 的好处，但我必须诚实地说：它不是万能药。Vibe Coding 有它独特的优势，也有需要警惕的局限。作为一个深度用户，我觉得有必要把这些话说明白——免得大家以为我只是在”吹捧新技术” (～￣▽￣)～

优势：扩展个人能力的利器

适合个人开发上手：Vibe Coding 最大的优势在于降低门槛。你不是职业程序员？没问题。你不是计算机专业毕业？也没问题。只要你能用自然语言描述需求，AI 就能帮你实现。这种”人人都能开发”的体验，是传统编程无法比拟的。
小项目和 demo 的完美工具：当你需要快速验证一个想法、开发一个小工具、或者做一个 demo 时，Vibe Coding 简直是神器。从想法到原型，可能只需要几个小时——而不是几天或几周。这种”创意到实现”的高效转化，让个人开发者的生产力得到了质的飞跃。芝加哥大学的研究显示，使用 AI 编程工具的开发者合并的 PR 数量增加了 39%²¹——这就是效率提升的铁证。
扩展个人能力边界：这是我最喜欢的一点。以前我不会写前端代码，现在有了 AI 的帮助，我也能开发出像样的 Web 应用；以前不熟悉某个技术栈，现在可以让 AI 帮我快速上手。Vibe Coding 让你的”能力半径”大大扩展——你不再局限于自己已经掌握的技能，而是可以”站在 AI 的肩膀上”触及更远的地方。
最好的创意工具：我甚至认为 Vibe Coding 是目前最好的创意工具。当你脑子里有一个想法时，不需要先花几个月学习编程、不需要找朋友帮忙、不需要等待——直接和 AI 对话，看着它一步步把你的想法变成现实。这种”即时反馈”的体验，会激发更多的创造力~ 有开发者形容 Cursor 这类工具是”理解开发作为思考和规划系统的绝对福音”²¹，我觉得这个评价很贴切。

局限：需要警惕的风险

大型项目的可靠性存疑：Vibe Coding 在小型项目中表现出色，但当项目规模变大时，问题就开始浮现了。AI 生成的代码可能缺乏全局架构的一致性、可能引入难以察觉的 bug、可能在性能优化方面考虑不足。对于一个需要长期维护、多人协作的大型工业级项目来说，这些风险是不可忽视的。我不是说 Vibe Coding 不能用，而是说——你要非常、非常谨慎。有趣的是，甚至有研究指出经验丰富的开发者在使用 AI 工具修复 bug 时，速度可能比不用 AI 慢 19%²²——这说明 AI 工具的效果并非总是正向的，它非常依赖于任务类型和开发者经验。
可能加速项目的”腐化”：这是一个很现实的问题。当 AI 生成大量代码后，如果缺乏严格的架构设计、代码审查、测试覆盖，项目很容易陷入”技术债”的陷阱。你可能在短期内快速完成了功能，但长期来看——代码变得越来越难维护、重构成本越来越高、bug 越来越难追踪。这就是”项目腐化”的典型表现。Arbisoft 的研究直接将这种现象称为”Vibe Coding 的阴暗面”²³，而 BayTech 咨询公司则用”Vibe Coding 宿醉”（The Vibe Coding Hangover）来形容这种累积问题²⁴——这些比喻都很形象。更惊人的是，有研究显示 AI 生成的代码可能成为”技术债务的快车道”²⁵，在追求速度的同时牺牲了可持续性。
人类难以维护：AI 生成的代码有时候会很”AI 风格”——比如过度设计、命名不符合团队规范、逻辑复杂难懂。如果你离开这个项目几个月，再回头看这些代码，可能会发现：自己都看不懂了。这对于需要长期维护的项目来说，是个严重的问题。Dev.to 上的一篇文章甚至用”谁不喜欢惊喜技术债务？”的反讽来描述这种现象²⁶——当你几个月后回看 AI 生成的代码，”惊喜”地发现自己完全看不懂了，那时候你就知道疼了。
公司级项目要慎重：在公司环境中使用 Vibe Coding，需要考虑更多因素：代码所有权（AI 生成的代码版权归谁？）、团队协作（其他开发者能理解和维护 AI 生成的代码吗？）、安全审计（AI 是否引入了安全漏洞？）、合规性（生成的代码是否符合公司编码规范？）。这些问题都不是简单能解决的——需要团队层面的策略和流程。有研究显示，AI 编码助手在企业环境中的使用可能导致安全漏洞增加——甚至有报告指出，AI 生成的代码在企业仓库中每月引入超过 10,000 个新的安全问题²⁷。更夸张的是，Apiiro 的研究显示，AI 工具在带来 4 倍开发速度的同时，也带来了 10 倍的安全风险²⁸——这个”4x 速度，10x 漏洞”的数据，足够让任何 CTO 夜不能寐了。
数据泄露风险：最后一个但同样重要的问题是——数据安全。当你使用 Vibe Coding 工具时，你的代码、你的想法、你的项目结构，都可能被上传到云端服务器。如果你在开发一个包含敏感信息的项目（比如金融系统、医疗系统、或者公司的核心产品），这种数据泄露的风险是不可接受的。虽然现在有本地部署的方案（比如使用本地模型），但能力上还是有差距。Veracode 的 2025 年报告发现，近 45% 的 AI 生成代码至少引入一个安全缺陷²⁹，而 Gartner 已将”脆弱输出”和”敏感数据泄露”列为 AI 编码助手的首要安全风险³⁰。卡巴斯基实验室也专门发文警告 vibe coding 和 LLM 助手的安全风险³¹——这些权威机构都在提醒我们：数据安全不是小事。

我的建议

那么，到底该不该用 Vibe Coding？我的建议是：分类对待，量力而行。

个人项目、小工具、demo：大胆用！这是 Vibe Coding 的主场，能极大提升你的效率。
中型项目：可以用，但要保持架构清晰、定期重构、写好测试。不要完全依赖 AI，要保留人类的”架构师”角色。
大型工业级项目：谨慎使用。可以作为辅助工具（比如生成样板代码、写文档、写测试），但核心架构、关键模块还是需要人类专家把控。
公司项目：需要团队共识。制定明确的规范——哪些场景可以用、哪些场景不能用、代码审查流程是什么、安全审计怎么做。不要让 Vibe Coding 成为”无人监管的黑盒”。
敏感项目：避免使用云端 Vibe Coding 工具。如果必须用，选择本地部署方案，或者确保数据脱敏后再使用。

Vibe Coding 是一个强大的工具，但它不是银弹。理解它的优势，也理解它的局限——这样才能真正用好它~

小结

从 Chatbot 到 Vibe Coding，我们正在见证 LLM 使用方式的深刻变革。Chatbot 作为起点，让大众第一次接触到 AI 的强大；但它的局限——上下文限制、任务复杂度瓶颈、与工作流的割裂——也催生了新的范式。Vibe Coding 代表了下一代 LLM 产品形态：它对人类用户友好（只需自然语言描述需求）、能与现代个人计算机良好协作（直接操作文件系统、执行命令、调用工具）、效率更高（减少手动搬运工作）、理解上下文更深入（感知整个项目状态）、支持可组合可复用的 Skills。

这个生态正在快速发展：Cursor 作为 AI 原生编辑器、Agent Skills 作为可复用技能包、Claude Code 作为命令行 AI 伴侣、OpenAI Codex 作为开源挑战者——每个产品都有自己的定位和优势，用户可以根据需求选择最合适的工具。而我自己的体验是：Codex GPT-5.2 High 让我嗅到了 AGI 的味道。它在复杂任务分解、跨领域知识迁移、自我纠错和学习等方面表现出的能力，已经超越了”工具”的范畴，更接近”合作伙伴”。我的 GitHub 仓库里有 30+ 个 Skills 和工作流，都是由 GPT-5.2 High 从零创建的——而且我至今还没有摸到这个模型的上限。

哈哈，写到这里，我突然想到：也许 AGI 不是一个”某天突然到来”的时刻，而是一个”逐渐逼近”的过程。GPT-5.2 High 可能还不是 AGI，但它确实让我看到了 AGI 的轮廓。而这个轮廓，正在变得越来越清晰~ 如果你还在用 Chatbot，我鼓励你试试 Vibe Coding 工具——Claude Code、Cursor、OpenAI Codex，哪个都行。我相信你会和我一样，发现一个全新的世界 (～￣▽￣)~

参考文献

文心一言 – 百度旗下 AI 智能助手. https://yiyan.baidu.com/
通义千问 – 阿里云大语言模型. https://tongyi.aliyun.com/
智谱清言 – 智谱 AI 打造的 GLM-4 系列 AI 助手. https://chatglm.cn/
Kimi – 月之暗面出品的 AI 智能助手. https://www.kimi.com/zh
DeepSeek – 深度求索 AI 智能助手. https://www.deepseek.com/
豆包 – 字节跳动旗下 AI 智能助手. https://www.doubao.com/
LobeHub – LobeChat: An open-source, highly extensible AI Chatbot framework. https://github.com/lobehub/lobe-chat
LobeHub Docs – LobeChat Plugin Development Guide. https://lobehub.com/docs/usage/plugins/development
本站文章 – Claude Code 和 Claude Skills 的工程设计. https://blognas.hwb0307.com/skill/6689
Cursor – The AI Code Editor. https://cursor.sh
Model Context Protocol – Introduction. https://modelcontextprotocol.io/introduction
Anthropic – Claude Code CLI Documentation. https://docs.anthropic.com/en/docs/build-with-claude/claude-for-developers
本站文章 – Vibe Coding CLI评测： Claude Code vs. OpenAI Codex vs. Gemini CLI. https://blognas.hwb0307.com/other/6923
OpenAI – Codex CLI Repository. https://github.com/openai/codex
本站项目 – pipelines Skills 目录. 本地项目路径：/Volumes/2T01/winE/PythonCloud/Agents/pipelines/skills，包含 30+ 个由 Codex GPT-5.2 High 创建的 Agent Skills。
本站文章 – Docker系列搭建个人聊天机器人LobeChat. https://blognas.hwb0307.com/linux/docker/5950
逗哥的 API – 第三方 AI API 服务. https://x.dogenet.win/i/kUOGvGyo
Cherry Studio – The All-in-One AI Assistant Desktop Client. https://github.com/CherryHQ/cherry-studio
ChatGPT-Next-Web – One-Click to deploy well-designed ChatGPT UI. https://github.com/ChatGPTNextWeb/ChatGPT-Next-Web
Open WebUI – ChatGPT-Style UI for OpenAI’s API & Local Models. https://github.com/open-webui/open-webui
Opsera – Cursor AI Adoption Trends: Real Data from the Fastest Growing Coding Tool. https://opsera.ai/blog/cursor-ai-adoption-trends-real-data-from-the-fastest-growing-coding-tool/
The Pragmatic Engineer – Cursor makes developers less effective? https://blog.pragmaticengineer.com/cursor-makes-developers-less-effective/
Arbisoft – The Dark Side of Vibe-Coding: Debugging, Technical Debt, and Security Risks. https://arbisoft.com/blogs/the-dark-side-of-vibe-coding-debugging-technical-debt-and-security-risks
BayTech Consulting – The Vibe Coding Hangover: Why CTOs Need to Wake Up. https://www.baytechconsulting.com/blog/vibe-coding-hangover-why-ctos-need-to-wake-up
Medium – Vibe Coding as Rube Goldberg Machine — Managing AI-Generated Technical Debt. https://medium.com/@adnanmasood/vibe-codings-technical-debt-speed-vs-sustainability-d412c0eeaacf
Dev.to – Vibe coding: Because who doesn’t love surprise technical debt? https://dev.to/coderabbitai/vibe-coding-because-who-doesnt-love-surprise-technical-debt-3c3b
LinkedIn – AI-Generated Code Risks: 2024-2025 Incidents & Frameworks. https://www.linkedin.com/pulse/ai-generated-code-risks-2024-2025-incidents-frameworks-faisal-yahya-qybxc
Apiiro – 4x Velocity, 10x Vulnerabilities: AI Coding Assistants Are Shipping More Risks. https://apiiro.com/blog/4x-velocity-10x-vulnerabilities-ai-coding-assistants-are-shipping-more-risks/
Veracode – 2025 Security Report: AI-Generated Code Security Analysis. https://www.veracode.com/blog/security-news/ai-generated-code-security-risks (注：具体报告链接需访问 Veracode 官网获取)
Trend Micro – Top 10 AI Security Risks for 2024. https://www.trendmicro.com/en/research/24/g/top-ai-security-risks.html
Kaspersky – Security risks of vibe coding and LLM assistants in 2025. https://www.kaspersky.com/blog/vibe-coding-2025-risks/54584/

---------------
完结，撒花！如果您点一下广告，可以养活苯苯😍😍😍

概览

前言