AI入门系列 如何使用大语言模型?

本博客由AI模型商OhMyGPT强力驱动!如何更快地访问本站?有需要可加电报群获得更多帮助。本博客用什么VPS?创作不易,请支持苯苯!推荐购买本博客的VIP喔,10元/年即可畅享所有VIP专属内容!

概览

  • Chatbot 是使用 LLM 最常见、最原始的方式,除了官方 App 和网站,像 LobeChat 这类基于 API 的第三方应用也是个不错的选择
  • 国产 AI 大模型已崛起,文心一言、通义千问、智谱清言、Kimi、DeepSeek 等产品在访问便利性、价格优势、本土化适配方面具有独特价值
  • Chatbot 交互模式存在明显局限性:上下文窗口有限、无法执行复杂任务、缺乏与工作流和本地文件的深度集成
  • Vibe Coding 正成为下一代 LLM 产品形态,生态快速发展,是未来趋势——它是对人类用户友好的 Agent 形态,能与现代个人计算机良好协作。里程碑进展包括 Cursor(AI 原生编辑器)、Agent Skills(可复用技能包)、Claude Code(CLI 伴侣)及竞品 OpenAI Codex
  • GPT-5.2 High 模型在复杂任务分解、跨领域知识迁移、自我纠错等方面表现突出——从文献综述到基金申请写作,30+ 个 Agent Skills 作品均由该模型创建,展现出接近 AGI 的能力轮廓
  • Vibe Coding 优势显著:适合个人开发上手、扩展能力边界、是快速验证创意的最佳工具;但也存在局限:大型项目可靠性存疑、可能加速项目腐化、人类难以维护、公司级项目需慎重、存在数据泄露风险

前言

在上一篇《介绍大语言模型》中,我们一起回顾了 LLM 的发展历史,从 RNN、LSTM 到 Transformer,再到 GPT 系列、Claude、Gemini 百家争鸣的时代,了解了”是什么”和”怎么来的”之后,很多小伙伴可能会问:那我到底该怎么用这些大模型呢? 从最早期的 ChatGPT 聊天框,到现在的 Claude Code、Cursor、Codex CLI,使用 LLM 的方式正在经历一场深刻的变革。今天这篇文章,我想和大家聊聊如何使用大语言模型——从最原始的 Chatbot 模式,到正在快速兴起的 Vibe Coding 范式,以及我亲身感受的 AGI 曙光 (~ ̄▽ ̄)~

Chatbot:最原始但依然有用的起点

Chatbot(聊天机器人)是使用大语言模型最常见、最原始的方式,本质上就是一个对话框:你发一句话,AI 回一句话,如此反复。ChatGPT 的爆发式流行,让这种交互模式深入人心——打开网页或 App,开始聊天,就这么简单。最直接的方式当然是使用各家的官方产品:

产品 特点 适合人群
ChatGPT OpenAI 官方,GPT-5 系列模型能力强,上下文窗口达 400K token,生态丰富 追求最新模型能力的用户
Claude Anthropic 出品,超长上下文窗口(1M token),对话风格自然 需要处理长文档、代码的用户
Gemini Google 原生多模态,1M tokens 超大上下文,免费额度慷慨 预算有限的个人开发者、学生
文心一言 百度出品,中文理解能力强,知识图谱丰富,支持多模态输入 主要使用中文的普通用户、企业用户
通义千问 阿里推出,长文本处理出色(最高支持 10M tokens),与阿里云生态深度集成 需要处理超长文档、企业级应用开发者
智谱清言 智谱 AI 打造,GLM-4 系列模型能力强,代码生成、数学推理表现突出 开发者、科研人员、学生
Kimi 月之暗面出品,2M tokens 超长上下文,文件解析能力强,支持网页搜索 需要分析大量文档、研报、代码的用户
DeepSeek 深度求和开发,性价比极高,开源模型能力强,代码和数学表现优秀 预算有限的个人开发者、技术爱好者
豆包 字节跳动推出,语音对话体验好,与抖音生态联动,轻量化部署 移动端用户、内容创作者

官方产品的优势在于第一手体验——你能最早用到最新发布的模型,比如 GPT-5、Claude Sonnet 4、Gemini 2.5 Pro 这些,而且官方 App 通常集成了各家特有的功能,比如 ChatGPT 的 Plugins、Claude 的 Artifacts、Gemini 的多模态能力。不过官方产品也有局限:数据隐私问题(你的对话会被上传到云端服务器)、网络依赖(国内访问需要特殊方法)、以及价格因素(GPT-5 和 Claude Sonnet 4 都不便宜)。更让人遗憾的是,OpenAI 和 Anthropic 长期以来对中国用户采取歧视性政策——OpenAI 早已明确禁止中国大陆用户访问其 API 服务,Anthropic 也紧随其后实施类似限制。这种”技术霸权”式的做法,不仅阻碍了 AI 技术的普惠发展,也让中国用户在享受最新 AI 成果时处处碰壁——明明是全人类共同创造的智慧结晶,却被人为地划出了国界线。

国产 AI 的崛起

表格里列出的国产 AI 产品,只是冰山一角。过去两年,中国大模型产业的发展速度可以用”突飞猛进”来形容——从最初的”跟跑”,到现在的”并跑”甚至在某些领域”领跑”,国产 AI 已经形成了自己独特的生态体系。

访问便利性是国产 AI 最直接的优势。你不需要翻墙、不需要找代理、不需要担心 IP 被封——直接打开官网或 App 就能用。这种”零门槛”体验,对于大多数国内用户来说是最实在的价值。而且国产产品普遍提供更慷慨的免费额度,像 DeepSeek、Kimi 这些,日常使用基本不需要付费——这对于学生党、个人开发者来说太友好了。

价格优势同样不可忽视。国产模型的 API 价格通常是国外产品的 1/5 甚至更低。我之前在评测中提到过,MiniMax M2 的价格只有 Claude 官方模型的 8% 左右13——这对于需要大量调用的开发者来说,成本差异是巨大的。而且很多国产模型提供”按需付费”的灵活模式,不像国外产品那样”一刀切”的订阅制。

本土化适配是国产 AI 的另一张王牌。文心一言背靠百度知道、百度百科的庞大知识库,对中文语境、文化背景、行业术语的理解更深入;通义千问与阿里云生态深度集成,企业用户可以无缝对接钉钉、阿里云服务;Kimi 的文件解析能力针对中文文档做了大量优化,处理 PDF、Word、Excel 这些常见格式时准确率更高。这种”接地气”的体验,是国外产品短期内难以复制的。

当然,国产 AI 也有自己的短板——比如在英文语境下的表现不如 GPT-5、在复杂推理任务上与 Claude Sonnet 4 还有差距、生态系统的丰富性(插件、第三方应用)也还不够成熟。但这个差距正在快速缩小,而且国产厂商在某些细分领域已经实现了超越:通义千问的 10M tokens 超长上下文、DeepSeek 在数学和代码任务上的出色表现、Kimi 的文件解析能力——这些都是”人无我有”或”人有我优”的亮点。

我觉得最重要的是:国产 AI 的崛起打破了”技术霸权”。以前中国用户想要用最好的 AI 模型,只能看国外公司的脸色——想用就用,不想用就封。现在有了国产选择,至少我们有了”备选方案”,有了”谈判筹码”。这对整个 AI 行业的健康发展是有利的——竞争驱动创新,用户最终受益~

基于 API 的第三方 Chatbot:LobeChat 的崛起

如果你不想用官方产品,或者想同时调用多个模型,那么基于 API 的第三方 Chatbot 应用是个不错的选择。这里我要特别推荐一下 LobeChat——一个开源的、现代化的 Chatbot 框架7。LobeChat 支持多模型统一管理(你可以在一个界面里同时使用 OpenAI、Anthropic、Google、国产大模型等)、自部署控制数据(支持 Docker、Vercel 等多种部署方式)、丰富的插件生态(TTS/STT 语音对话、多语言、插件市场)以及现代化的 UI 设计。我自己之前也写过详细的 LobeChat 教程16,这里就不展开了。

除了 LobeChat,开源社区还有不少优秀的 Chatbot 项目值得推荐:Cherry Studio(跨平台桌面 AI 客户端,支持 300+ 模型,界面美观,功能完善)18ChatGPT-Next-Web(一站式跨平台 ChatGPT UI,支持一键部署到 Vercel,轻量简洁)19Open WebUI(原名 Ollama WebUI,功能完整的 ChatGPT 替代品,支持多种模型和本地部署)20。这些项目各有特色,你可以根据自己的需求选择——比如想要桌面端美观体验就选 Cherry Studio,追求简洁就选 ChatGPT-Next-Web,需要完整功能就选 Open WebUI。

顺便提一下我用的第三方 API 服务——OhMyGPT17,价格亲民、稳定性好,而且最关键的是支持开具发票(这对于有报销需求的小伙伴来说太重要了)。我平时就是用它来接入 GPT-5、Claude Sonnet 4 这些模型,配合 LobeChat 使用体验很好~

Chatbot 的局限:为什么它正在”落后”?

虽然 Chatbot 依然有用,但它确实存在一些根本性的局限

  • 上下文窗口限制:即使是最新的 Claude Sonnet 4(1M token)、Gemini 2.5 Pro(1M token)或 GPT-5(400K token),也总有边界。处理超大型项目、整本书籍、复杂历史记录时,还是会捉襟见肘。

  • 任务复杂度瓶颈:Chatbot 擅长”对话”,但不擅长”做事”。你问它问题、让它写代码、翻译文档,这些都没问题。但如果你让它”帮我重构整个项目的架构”或者”批量处理这 100 个文件”,它就无能为力了——因为它无法直接操作你的文件系统和开发环境。

  • 与工作流的割裂:Chatbot 是一个”孤岛”——你在网页里聊天,然后手动复制结果到你的编辑器、终端、笔记软件里。这个过程本身就很低效,而且容易出错。

  • 缺乏状态和记忆:虽然现代 Chatbot 有会话历史,但它们对你的工作环境、项目结构、个人习惯一无所知。每次新开一个对话,它就像失忆了一样,需要你重新解释上下文。

  • 无法执行复杂多步任务:比如”部署一个应用到服务器并监控运行状态”这种任务涉及多个步骤(构建、上传、配置、启动、监控),Chatbot 只能给你一步步的指令,但无法真正执行它们。

这些局限并不是 Chatbot 本身的问题,而是交互模式的固有限制。要突破这些限制,需要一种新的范式——这就是 Vibe Coding 正在做的事情。

Vibe Coding:下一代 LLM 产品形态

什么是 Vibe Coding?

Vibe Coding 是一种新兴的编程范式,核心思想是:用户不再直接编写每一行代码或手动执行每一个操作,而是通过与 AI 的对话来描述需求,由 AI 在真实环境中生成和修改代码、执行任务9

“Vibe”这个词很有意思——它强调的是一种”感觉”、一种”直觉”、一种”氛围”。Vibe Coding 不是让你去理解每一个技术细节,而是让 AI 理解你的意图(你的”vibe”),然后帮你实现。这听起来有点像是在”指挥 AI 助手”而不是”写代码”,哈哈~

Vibe Coding 与 Chatbot 的本质区别

维度 Chatbot Vibe Coding
交互焦点 对话 任务执行
工作环境 隔离的网页/App 与开发环境深度集成
任务复杂度 单步或简单多步 复杂多步任务、跨文件操作
状态感知 完全感知项目状态
执行能力 仅生成文本 读写文件、执行命令、调用工具

Chatbot 是”聊天的工具”,Vibe Coding 是”做事的工具”。这个区别看似微小,实则意义重大~

为什么 Vibe Coding 是未来?

Vibe Coding 之所以被认为是未来的方向,有几个核心原因:

  • 对人类用户友好:你不需要成为技术专家就能让 AI 帮你完成任务。描述需求是人类的天性(我们每天都在和同事、家人沟通),而写代码、记命令则是需要学习的技能。Vibe Coding 把门槛降到了”会说话”的层面~

  • 与现代个人计算机的良好协作:现代 PC 的核心是文件系统、进程、网络——这些都是”可操作的对象”。Vibe Coding 工具(如 Claude Code、OpenAI Codex)可以直接操作这些对象,就像一个能干的系统管理员。相比之下,Chatbot 只能”谈论”这些对象,却无法”触碰”它们。

  • 效率提升:在 Chatbot 模式下,你需要手动复制 AI 生成的代码到编辑器、手动执行命令、手动检查结果。Vibe Coding 则让 AI 直接完成这些操作——减少了大量”搬运”工作,让你专注于”思考”而不是”操作”。

  • 更好的上下文理解:Vibe Coding 工具可以读取你的整个项目代码库,理解架构、依赖关系、代码风格。这意味着它给出的建议更加”量身定制”,而不是通用模板。

  • 可组合、可复用:Agent Skills 系统让 AI 的能力可以像”插件”一样组合。你可以让 AI 同时调用”代码审查”、”文档生成”、”测试”等多个技能,完成复杂任务。这个我们在后面会详细展开~

Vibe Coding 的里程碑进展

Cursor:AI 原生编辑器

Cursor 是一个”为 AI 而生”的代码编辑器,基于 VS Code fork 而来10。它的核心理念是:AI 不是”附加功能”,而是编辑器的一等公民。Cursor 的核心特性包括 Tab 键自动补全(AI 根据上下文生成语义化建议)、Cmd+K 快速编辑(在原位修改代码)、Cmd+L 对话模式(与编辑器深度集成)以及多文件编辑(保持架构一致性)。我身边很多开发者朋友都已经从 VS Code 迁移到 Cursor 了,大家的反馈基本一致:一旦习惯了 AI 原生编辑器,就很难回去了。哈哈,这种感觉就像从功能机切换到智能手机——回不去了~

Claude Code:命令行的 AI 伴侣

Claude Code 是 Anthropic 官方推出的 CLI 工具,可以理解成”命令行版的 Cursor”12。它的核心定位是:让你的终端变成一个 AI 驱动的生产力中心。Claude Code 的几个杀手级特性包括与项目的深度集成(可以读取整个代码库、理解 Git 历史、执行 Shell 命令、调用 MCP 服务器)、Agent Skills 开发体验极佳、响应速度最快以及全程母语对话支持。我自己现在 90% 的编程任务都用 Claude Code 完成,从快速原型开发到复杂架构重构,它都能很好地处理。特别是配合国产模型(如智谱 GLM-4.7、MiniMax M2),成本可以降到很低——MiniMax M2 的价格甚至只有 Claude 官方模型的 8% 左右13

OpenAI Codex:开源挑战者

OpenAI Codex CLI(简称 Codex)是开源社区对 Claude Code 的回应14。它基于 Rust 重写,强调性能、安全性和可定制性。Codex 的几个亮点包括完全开源(Apache 2.0 许可证)、与 OpenAI 生态深度集成(ChatGPT Plus 用户或 GPT-4 API 用户一键上手)以及并行任务处理(支持同时运行多个 Agent)。不过 Codex 也有自己的短板:Agent Skills 开发体验较差、推理过程全程英文、响应速度稍慢。

Agent Skills:可复用的技能包

Agent Skills 是 Vibe Coding 生态中一个非常重要的概念11。它的核心思想是:把 AI 的能力封装成可复用、可组合的”技能包”。打个比方:Chatbot 就像一个”万能助手”,但每次你都要从头告诉它怎么做事。Agent Skills 则像给这个助手配了一套”工具箱”——里面有专门做文档转换的技能、专门做代码审查的技能、专门做文献综述的技能……当你需要做某件事时,AI 会自动选择合适的技能。Agent Skills 的几个关键优势包括可复用性(一个 Skill 可在多个项目中复用)、可组合性(多个 Skills 可组合完成复杂任务)、专业性(每个 Skill 都在某个领域”深耕”)以及可维护性(模块化架构让长期维护成为可能)。我自己之前写过一篇关于 Claude Code 和 Agent Skills 工程设计的文章9,想深入了解的小伙伴可以去看看。我在开发 Agent Skills 的时候,深刻感受到这个架构的强大。比如我有个”文献精读”的 Skill,专门用来读医学论文——它知道怎么提取实验设计、统计方法、主要结论,然后生成结构化摘要。这个 Skill 我已经用了几十篇论文,每次都能节省至少 30 分钟的时间 (~ ̄▽ ̄)~

生态发展:百家争鸣的时代

除了上面提到的三个主要工具,Vibe Coding 生态还有很多其他值得关注的项目:Windsurf(由 Codeium 开发的 AI 原生编辑器,主打”实时协作”和”多模态输入”)、Aider(专注于 Git 工作流的 AI 编程助手)以及 Continue(VS Code 扩展,把 AI 能力注入到传统编辑器中)。这个生态正在快速发展,每个月都有新工具、新功能、新模型出现。这种”百花齐放”的局面,对用户来说是好事——竞争驱动创新,我们能看到越来越好的产品~

我亲身体验的 AGI 曙光:Codex GPT-5.2 High

聊了这么多理论和方法,现在我想聊聊我自己的使用体验——特别是 OpenAI Codex 的 GPT-5.2 High 模型给我带来的震撼。

让我嗅到 AGI 味道的模型

我最早是在 OpenAI Codex CLI 中接触到 GPT-5.2 High 这个模型的。一开始我以为它只是又一个”更好的 GPT-4″,但用了一段时间后,我发现这个模型有点不一样——它在很多任务里都做得非常好,好到让我开始思考:这是不是 AGI 的前奏?

让我举几个具体的例子:

  • 复杂任务分解:我有个任务需要”分析 100 篇医学文献,提取关键信息,生成结构化报告”。GPT-5.2 High 不是简单地”逐篇处理”,而是自己设计了多层工作流:先用轻量模型筛选相关性,再用中等模型提取结构化信息,最后用重量模型综合分析和撰写报告。这种”任务分解和优化”的能力,已经超过了简单的”执行指令”,更像是”思考和规划”~

  • 跨领域知识迁移:有次我在做一个生信分析任务,需要结合 Python 编程、R 语言统计、医学背景知识。GPT-5.2 High 能够在这三个领域之间无缝切换,而且理解它们之间的关联——比如”这个统计方法在医学文献中通常用来回答什么问题”、”Python 的这个库和 R 的那个包功能类似但性能如何”。这种跨领域的理解和整合,是人类专家的标志性行为~

  • 自我纠错和学习:最让我印象深刻的是它的”自我纠错”能力。有次它在生成一段数据处理代码时,发现中间步骤的数据分布异常,于是主动停下来,重新设计了预处理流程,并解释了为什么原来的方法有问题、新方法为什么更好。这种”反思和改进”的行为,已经非常接近人类专家的工作方式了~

我的Agent Skill作品集

我自己的 Agent Skill 作品集,就是 GPT-5.2 High 能力的最好证明。我在 GitHub 上维护了两个仓库——ChineseResearchLaTeXskills,里面有 30+ 个 Skill 或工作流,从文献综述、数据分析到 pipeline开发,几乎涵盖了日常工作需要的所有场景,感兴趣的小伙伴欢迎关注~ 让我列举几个有代表性的 Skills:

  • systematic-literature-review:系统文献综述生成器。可以自动设计检索策略、从多个学术数据库检索、去重、AI 逐篇阅读并评分、按高分优先比例选文、自动生成”综/述”字数预算、资深领域专家自由写作。这个 Skill 处理过医学、生物学、计算机科学等多个领域的文献综述,每次都能节省我至少 5-10 小时的时间~

  • nsfc-research-content-writer:国家自然科学基金申请书”研究内容”章节写作助手。它能基于用户提供的最小信息表,输出价值与必要性、现状不足、科学问题/假说与项目切入点,并保持模板结构不被破坏。这个 Skill 在 2025 年的国自然申请季帮了我大忙~

  • auto-test-project:项目级批判性测试工具。支持多轮 A 轮迭代(分析 → 计划 → 优化 → 轻量测试)和 B 轮质量检查,系统化发现、记录、修复问题,并沉淀可追溯的 plans/tests/ 文档。这个工具我现在用来测试所有新开发的 Skills~

很多skill就不介绍了,自己去github看。这些 Skills 的共同点是:都是由 GPT-5.2 High 从零创建的。我只需要用自然语言描述需求,GPT-5.2 High 就能理解我的意图、设计架构、编写代码、调试测试、生成文档。整个过程就像和一个有经验的开发者合作——只不过这个”开发者”不知疲倦、知识渊博、响应迅速~

Vibe Coding 的优势与局限

聊了这么多 Vibe Coding 的好处,但我必须诚实地说:它不是万能药。Vibe Coding 有它独特的优势,也有需要警惕的局限。作为一个深度用户,我觉得有必要把这些话说明白——免得大家以为我只是在”吹捧新技术” (~ ̄▽ ̄)~

优势:扩展个人能力的利器

  • 适合个人开发上手:Vibe Coding 最大的优势在于降低门槛。你不是职业程序员?没问题。你不是计算机专业毕业?也没问题。只要你能用自然语言描述需求,AI 就能帮你实现。这种”人人都能开发”的体验,是传统编程无法比拟的。

  • 小项目和 demo 的完美工具:当你需要快速验证一个想法、开发一个小工具、或者做一个 demo 时,Vibe Coding 简直是神器。从想法到原型,可能只需要几个小时——而不是几天或几周。这种”创意到实现”的高效转化,让个人开发者的生产力得到了质的飞跃。芝加哥大学的研究显示,使用 AI 编程工具的开发者合并的 PR 数量增加了 39%21——这就是效率提升的铁证。

  • 扩展个人能力边界:这是我最喜欢的一点。以前我不会写前端代码,现在有了 AI 的帮助,我也能开发出像样的 Web 应用;以前不熟悉某个技术栈,现在可以让 AI 帮我快速上手。Vibe Coding 让你的”能力半径”大大扩展——你不再局限于自己已经掌握的技能,而是可以”站在 AI 的肩膀上”触及更远的地方。

  • 最好的创意工具:我甚至认为 Vibe Coding 是目前最好的创意工具。当你脑子里有一个想法时,不需要先花几个月学习编程、不需要找朋友帮忙、不需要等待——直接和 AI 对话,看着它一步步把你的想法变成现实。这种”即时反馈”的体验,会激发更多的创造力~ 有开发者形容 Cursor 这类工具是”理解开发作为思考和规划系统的绝对福音”21,我觉得这个评价很贴切。

局限:需要警惕的风险

  • 大型项目的可靠性存疑:Vibe Coding 在小型项目中表现出色,但当项目规模变大时,问题就开始浮现了。AI 生成的代码可能缺乏全局架构的一致性、可能引入难以察觉的 bug、可能在性能优化方面考虑不足。对于一个需要长期维护、多人协作的大型工业级项目来说,这些风险是不可忽视的。我不是说 Vibe Coding 不能用,而是说——你要非常、非常谨慎。有趣的是,甚至有研究指出经验丰富的开发者在使用 AI 工具修复 bug 时,速度可能比不用 AI 慢 19%22——这说明 AI 工具的效果并非总是正向的,它非常依赖于任务类型和开发者经验。

  • 可能加速项目的”腐化”:这是一个很现实的问题。当 AI 生成大量代码后,如果缺乏严格的架构设计、代码审查、测试覆盖,项目很容易陷入”技术债”的陷阱。你可能在短期内快速完成了功能,但长期来看——代码变得越来越难维护、重构成本越来越高、bug 越来越难追踪。这就是”项目腐化”的典型表现。Arbisoft 的研究直接将这种现象称为”Vibe Coding 的阴暗面”23,而 BayTech 咨询公司则用”Vibe Coding 宿醉”(The Vibe Coding Hangover)来形容这种累积问题24——这些比喻都很形象。更惊人的是,有研究显示 AI 生成的代码可能成为”技术债务的快车道”25,在追求速度的同时牺牲了可持续性。

  • 人类难以维护:AI 生成的代码有时候会很”AI 风格”——比如过度设计、命名不符合团队规范、逻辑复杂难懂。如果你离开这个项目几个月,再回头看这些代码,可能会发现:自己都看不懂了。这对于需要长期维护的项目来说,是个严重的问题。Dev.to 上的一篇文章甚至用”谁不喜欢惊喜技术债务?”的反讽来描述这种现象26——当你几个月后回看 AI 生成的代码,”惊喜”地发现自己完全看不懂了,那时候你就知道疼了。

  • 公司级项目要慎重:在公司环境中使用 Vibe Coding,需要考虑更多因素:代码所有权(AI 生成的代码版权归谁?)、团队协作(其他开发者能理解和维护 AI 生成的代码吗?)、安全审计(AI 是否引入了安全漏洞?)、合规性(生成的代码是否符合公司编码规范?)。这些问题都不是简单能解决的——需要团队层面的策略和流程。有研究显示,AI 编码助手在企业环境中的使用可能导致安全漏洞增加——甚至有报告指出,AI 生成的代码在企业仓库中每月引入超过 10,000 个新的安全问题27。更夸张的是,Apiiro 的研究显示,AI 工具在带来 4 倍开发速度的同时,也带来了 10 倍的安全风险28——这个”4x 速度,10x 漏洞”的数据,足够让任何 CTO 夜不能寐了。

  • 数据泄露风险:最后一个但同样重要的问题是——数据安全。当你使用 Vibe Coding 工具时,你的代码、你的想法、你的项目结构,都可能被上传到云端服务器。如果你在开发一个包含敏感信息的项目(比如金融系统、医疗系统、或者公司的核心产品),这种数据泄露的风险是不可接受的。虽然现在有本地部署的方案(比如使用本地模型),但能力上还是有差距。Veracode 的 2025 年报告发现,近 45% 的 AI 生成代码至少引入一个安全缺陷29,而 Gartner 已将”脆弱输出”和”敏感数据泄露”列为 AI 编码助手的首要安全风险30。卡巴斯基实验室也专门发文警告 vibe coding 和 LLM 助手的安全风险31——这些权威机构都在提醒我们:数据安全不是小事。

我的建议

那么,到底该不该用 Vibe Coding?我的建议是:分类对待,量力而行

  • 个人项目、小工具、demo:大胆用!这是 Vibe Coding 的主场,能极大提升你的效率。
  • 中型项目:可以用,但要保持架构清晰定期重构写好测试。不要完全依赖 AI,要保留人类的”架构师”角色。
  • 大型工业级项目谨慎使用。可以作为辅助工具(比如生成样板代码、写文档、写测试),但核心架构、关键模块还是需要人类专家把控。
  • 公司项目需要团队共识。制定明确的规范——哪些场景可以用、哪些场景不能用、代码审查流程是什么、安全审计怎么做。不要让 Vibe Coding 成为”无人监管的黑盒”。
  • 敏感项目避免使用云端 Vibe Coding 工具。如果必须用,选择本地部署方案,或者确保数据脱敏后再使用。

Vibe Coding 是一个强大的工具,但它不是银弹。理解它的优势,也理解它的局限——这样才能真正用好它~

小结

从 Chatbot 到 Vibe Coding,我们正在见证 LLM 使用方式的深刻变革。Chatbot 作为起点,让大众第一次接触到 AI 的强大;但它的局限——上下文限制、任务复杂度瓶颈、与工作流的割裂——也催生了新的范式。Vibe Coding 代表了下一代 LLM 产品形态:它对人类用户友好(只需自然语言描述需求)、能与现代个人计算机良好协作(直接操作文件系统、执行命令、调用工具)、效率更高(减少手动搬运工作)、理解上下文更深入(感知整个项目状态)、支持可组合可复用的 Skills。

这个生态正在快速发展:Cursor 作为 AI 原生编辑器、Agent Skills 作为可复用技能包、Claude Code 作为命令行 AI 伴侣、OpenAI Codex 作为开源挑战者——每个产品都有自己的定位和优势,用户可以根据需求选择最合适的工具。而我自己的体验是:Codex GPT-5.2 High 让我嗅到了 AGI 的味道。它在复杂任务分解、跨领域知识迁移、自我纠错和学习等方面表现出的能力,已经超越了”工具”的范畴,更接近”合作伙伴”。我的 GitHub 仓库里有 30+ 个 Skills 和工作流,都是由 GPT-5.2 High 从零创建的——而且我至今还没有摸到这个模型的上限。

哈哈,写到这里,我突然想到:也许 AGI 不是一个”某天突然到来”的时刻,而是一个”逐渐逼近”的过程。GPT-5.2 High 可能还不是 AGI,但它确实让我看到了 AGI 的轮廓。而这个轮廓,正在变得越来越清晰~ 如果你还在用 Chatbot,我鼓励你试试 Vibe Coding 工具——Claude Code、Cursor、OpenAI Codex,哪个都行。我相信你会和我一样,发现一个全新的世界 (~ ̄▽ ̄)~

参考文献

  1. 文心一言 – 百度旗下 AI 智能助手. https://yiyan.baidu.com/
  2. 通义千问 – 阿里云大语言模型. https://tongyi.aliyun.com/
  3. 智谱清言 – 智谱 AI 打造的 GLM-4 系列 AI 助手. https://chatglm.cn/
  4. Kimi – 月之暗面出品的 AI 智能助手. https://www.kimi.com/zh
  5. DeepSeek – 深度求索 AI 智能助手. https://www.deepseek.com/
  6. 豆包 – 字节跳动旗下 AI 智能助手. https://www.doubao.com/
  7. LobeHub – LobeChat: An open-source, highly extensible AI Chatbot framework. https://github.com/lobehub/lobe-chat
  8. LobeHub Docs – LobeChat Plugin Development Guide. https://lobehub.com/docs/usage/plugins/development
  9. 本站文章 – Claude Code 和 Claude Skills 的工程设计. https://blognas.hwb0307.com/skill/6689
  10. Cursor – The AI Code Editor. https://cursor.sh
  11. Model Context Protocol – Introduction. https://modelcontextprotocol.io/introduction
  12. Anthropic – Claude Code CLI Documentation. https://docs.anthropic.com/en/docs/build-with-claude/claude-for-developers
  13. 本站文章 – Vibe Coding CLI评测: Claude Code vs. OpenAI Codex vs. Gemini CLI. https://blognas.hwb0307.com/other/6923
  14. OpenAI – Codex CLI Repository. https://github.com/openai/codex
  15. 本站项目 – pipelines Skills 目录. 本地项目路径:/Volumes/2T01/winE/PythonCloud/Agents/pipelines/skills,包含 30+ 个由 Codex GPT-5.2 High 创建的 Agent Skills。
  16. 本站文章 – Docker系列 搭建个人聊天机器人LobeChat. https://blognas.hwb0307.com/linux/docker/5950
  17. 逗哥的 API – 第三方 AI API 服务. https://x.dogenet.win/i/kUOGvGyo
  18. Cherry Studio – The All-in-One AI Assistant Desktop Client. https://github.com/CherryHQ/cherry-studio
  19. ChatGPT-Next-Web – One-Click to deploy well-designed ChatGPT UI. https://github.com/ChatGPTNextWeb/ChatGPT-Next-Web
  20. Open WebUI – ChatGPT-Style UI for OpenAI’s API & Local Models. https://github.com/open-webui/open-webui
  21. Opsera – Cursor AI Adoption Trends: Real Data from the Fastest Growing Coding Tool. https://opsera.ai/blog/cursor-ai-adoption-trends-real-data-from-the-fastest-growing-coding-tool/
  22. The Pragmatic Engineer – Cursor makes developers less effective? https://blog.pragmaticengineer.com/cursor-makes-developers-less-effective/
  23. Arbisoft – The Dark Side of Vibe-Coding: Debugging, Technical Debt, and Security Risks. https://arbisoft.com/blogs/the-dark-side-of-vibe-coding-debugging-technical-debt-and-security-risks
  24. BayTech Consulting – The Vibe Coding Hangover: Why CTOs Need to Wake Up. https://www.baytechconsulting.com/blog/vibe-coding-hangover-why-ctos-need-to-wake-up
  25. Medium – Vibe Coding as Rube Goldberg Machine — Managing AI-Generated Technical Debt. https://medium.com/@adnanmasood/vibe-codings-technical-debt-speed-vs-sustainability-d412c0eeaacf
  26. Dev.to – Vibe coding: Because who doesn’t love surprise technical debt? https://dev.to/coderabbitai/vibe-coding-because-who-doesnt-love-surprise-technical-debt-3c3b
  27. LinkedIn – AI-Generated Code Risks: 2024-2025 Incidents & Frameworks. https://www.linkedin.com/pulse/ai-generated-code-risks-2024-2025-incidents-frameworks-faisal-yahya-qybxc
  28. Apiiro – 4x Velocity, 10x Vulnerabilities: AI Coding Assistants Are Shipping More Risks. https://apiiro.com/blog/4x-velocity-10x-vulnerabilities-ai-coding-assistants-are-shipping-more-risks/
  29. Veracode – 2025 Security Report: AI-Generated Code Security Analysis. https://www.veracode.com/blog/security-news/ai-generated-code-security-risks (注:具体报告链接需访问 Veracode 官网获取)
  30. Trend Micro – Top 10 AI Security Risks for 2024. https://www.trendmicro.com/en/research/24/g/top-ai-security-risks.html
  31. Kaspersky – Security risks of vibe coding and LLM assistants in 2025. https://www.kaspersky.com/blog/vibe-coding-2025-risks/54584/

---------------
完结,撒花!如果您点一下广告,可以养活苯苯😍😍😍


感谢OhMyGPT的友情赞助 (ฅ´ω`ฅ) 本博客基于m2w创作。版权声明:除特殊说明,博客文章均为Bensz原创,依据CC BY-SA 4.0许可证进行授权,转载请附上出处链接及本声明。VIP内容严禁转载!由于可能会成为AI模型(如chatGPT)的训练样本,本博客禁止将AI自动生成内容作为文章上传(特别声明时除外)。如有需要,请至学习地图系统学习本博客的教程。加Telegram群可获得更多帮助喔! | 博客订阅:RSS | 广告招租请留言 | 博客VPS | 致谢渺软公益CDN |
暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇