本文最后更新于 62 天前，如有失效请评论区留言。

本博客由科研AI Agent实验室BenszResearch强力驱动！如何更快地访问本站？有需要可加电报群获得更多帮助。本博客用什么VPS？创作不易，请支持苯苯！推荐购买本博客的VIP喔，10元/年即可畅享所有VIP专属内容！

概览

科研 AI 写作的核心边界可以概括为一句话：形式可以交给 AI，问题必须留给自己
科研写作里大量篇幅都在完成“形式合规”的工作，这部分不一定创造新思想，却承担着展示细节、降低误解和通过基本质量门槛的作用
国自然标书和 SCI 论文是两个最典型的场景：前者适合让 AI 补齐规范性章节，后者适合在原始数据和图表注释清楚后生成可继续打磨的第 1 稿
AI 在格式、排版、引用清单、投稿 checklist 和多版本一致性检查上杠杆很高，但所有事实、数字、引用和学术判断都必须由人最终核对
真正值得警惕的不是”AI 帮你写了多少字”，而是你有没有能力判断这些字是否准确、是否有锋芒、是否符合学术诚信底线

前言

最近几个月，我在标书、论文、综述、Cover Letter、Response to Reviewers 等各种科研写作场景里大量使用了 AI。一开始多少有点忐忑：写作毕竟是科研最“高级”的部分，让一个语言模型大段大段地写，会不会有点偷懒？但用得越多，我反而越冷静下来，越能看清一件事——科研写作里真正承载思想的内容，比我们以为的要少得多。

绝大部分写作工作其实是在做“形式的搬运”：把一个已经成立的想法，按照某种学科共同体认可的语序、结构和措辞翻译出来。这一层工作量极大、消耗心力极高，但它不是“科研”本身，更像是科研成果进入共同体之前必须经过的包装和翻译。AI 真正擅长的，正是帮我们更高效地完成这一层。

本文主要讨论科研 AI 写作的边界：哪些地方放心交给 AI，哪些地方必须人自己来，哪些地方是“AI 起草、人来定调”。讨论的对象主要是科研场景下的写作——国自然标书、SCI 论文、综述、回复审稿人、各类申报材料——而不是泛泛的“AI 写作”。

形式与问题的分界线

如果你写过一份正经的国自然标书，或者投过一篇带补充材料的 SCI 论文，你会发现一件让人沮丧的事：真正花在“思考”上的时间，可能连总时间的三分之一都不到。

剩下的时间都去哪了？大多花在了形式上。LaTeX 模板里某个 package 报错、参考文献的格式跟期刊要求对不上、表格在 Word 里跨页错位、补充材料的图编号要重新排、Cover Letter 的格式不知道该按谁家的来、Response to Reviewers 的格式要不要用 itemize、bibtex 里某个条目缺了 DOI、Figure 的字号在最终缩印后看不清——这些事情每一件单独看都不大，但堆在一起，是真的会把一个研究者的精力消耗到怀疑人生的程度。

更要命的是，这些工作几乎完全不创造科学价值。它们的存在是为了让你的成果能够被“传递”出去，但它们本身不增加任何信息量。你花两个小时调好的参考文献格式，对人类知识的增量贡献是零。

但也正因为如此，形式才不能被简单地理解为“可有可无的装饰”。形式合规是一种基础质量控制。它让别人能顺畅地理解你的研究，也让评审、编辑和审稿人快速判断：这个项目有没有被认真组织过？这个作者是否具备基本训练？说得直白一点，形式都写不好，水平大概率也高不到哪里去，至少很难让人放心把资源交给你。

所以科研 AI 写作的第一个原则，不是“让 AI 替我写”，而是：把那些规则明确、重复度高、表达模式稳定的形式性工作交给 AI，把真正需要判断力的科学问题留给自己。

国自然标书：让 AI 守住形式底线

评审专家其实没那么多时间

很多刚开始写本子的小伙伴会有一种错觉：评审专家会逐字逐句地读我写的每一段。但凡上过几次会、跟评审专家聊过几句，你就会发现真相相当残酷——一份本子真正被仔细看的时间，往往只有几分钟。

会评阶段更甚。一个评审专家手上可能压着几十份本子，分到每一本上的时间被严格压缩。即便是函评，专家也基本是先扫摘要、再扫立项依据的最后一段（科学问题与假说）、再扫研究内容的章节标题、研究基础里看几篇代表作，剩下的部分大多是“扫一眼有没有明显毛病”。

这意味着什么？意味着一份标书里真正决定生死的内容，可能就是那么几百字到一两千字。它们大致集中在这些地方：

题目和摘要
科学问题与关键假说
创新点
关键预实验结果
研究基础里最硬的一两篇代表作

这些地方必须由你亲自反复打磨，斟酌每一个用词，因为它们是评审专家会真正“消化”的部分。

剩下的呢？剩下的可能占了整本标书 80% 以上的篇幅。研究内容展开、技术路线、可行性分析、年度计划、风险预案、工作基础里的普通铺垫，这些章节通常不会单独决定一个本子能不能中，但它们会决定评审专家在快速翻阅时会不会被低级问题绊倒。

这些部分的价值更像一种”卫生因素”（借用 Herzberg 的说法——做好了不会让人满意，但做差了一定让人不满）：写好了未必明显加分，写差了一定扣分。AI 在这里的意义，就是帮你把这条底线守稳。

AI 在这里的角色

理解了上面这一点，AI 的位置就非常清楚了：它很适合承担那些规则明确、表达规范、但不决定核心判断的写作工作。

研究方法、技术路线的细节描述、可行性分析的大段论证、研究基础里非核心的工作描述、研究计划的年度安排、可能遇到的问题与对策——这些章节有一个共同点：它们的内容由前面已经定下来的研究内容自动推导出来，本身不承载新的科学信息，只是把同一件事用另一种角度再说一遍。

这种“信息冗余但形式必要”的内容，恰好是大语言模型的舒适区。你只需要把核心研究内容、技术手段、预期目标喂给它，它能给你产出一版结构完整、措辞规范、术语正确的稿子。这种稿子可能没什么惊喜，但它“长得像一份合格的标书”，足以让评审专家在快速翻阅时不挑出什么毛病。

而你节省下来的时间，可以全部投入到那些真正决定胜负的几百到一两千字上——反复打磨题目、推敲假说的提法、推演创新点的表述、挑选最有说服力的预实验图。这才是写本子真正的“复利”所在。

论文：数据和注释才是根

第 1 稿能交给 AI 到什么程度

论文的情况和标书有些类似，但又有微妙的不同。论文的核心是原始数据和对数据的注释——也就是你做了什么实验、得到了什么结果、你对这些结果的解读是什么。这一层是 AI 完全无法替代的，因为数据本身只能在你的实验室里产生。

但是，当原始数据和你对每张图/表的注释都已经准备好之后，AI 可以非常高效地帮你产出论文的第 1 稿。这是最近几个月里我自己用得最多的一种论文写作的工作流。

具体来说，你需要按图准备好几类素材：每张主图和补充图想要传达的核心信息，对应的方法学描述，比如用了什么模型、什么剂量、什么统计方法；关键的对照组与处理组；必要的 p 值和效应量；最重要的是，你对这些结果的科学解读。

把这些素材结构化地交给 AI，它可以在一两个小时内给你拼出一篇大致符合 SCI 论文形态的稿子：摘要、引言、结果各小节、讨论的主要段落、方法学的标准化描述，甚至 Figure Legend 都能给你写得八九不离十。

论文项目越工程化，AI 越可靠

这里的关键词其实不是“让 AI 写”，而是先把论文项目整理到 AI 能够可靠读取的状态。我最近做一篇真实论文时，体会尤其明显：如果只是把一堆 Word、Excel、图片、参考文献和零散想法扔给 AI，它很容易写出一篇看似完整、实则不可核查的稿子；但如果论文项目本身已经被整理成清晰的工程，比如正文有稳定的 LaTeX 源文件，摘要、引言、结果、讨论、方法学、图注、补充材料各自有明确位置，参考文献集中在一个 bib 文件，补充表有独立的导出脚本，投稿清单和期刊格式要求也单独保存，那么 AI 的能力会完全不一样。

这时候 AI 不是在“凭空创作”，而是在一个有边界的项目里做协作：它可以针对某一节做重写，可以检查结果段落和图注是否互相打架，可以帮你把讨论部分的逻辑锋芒磨出来，也可以在构建失败时沿着日志定位问题。更重要的是，每一次修改都有文件位置、有上下文、有构建结果可以回看。换句话说，论文 AI 写作越工程化，越不容易变成玄学。

这里也顺手推荐一下我自己在 ChineseResearchLaTeX 里维护的 paper 系列 skills。它们本质上就是把上面这套“图表注释 + LaTeX 论文项目 + 人类作者判断”的工作流工程化。

paper-write-sci 面向 SCI 论文正文写作、修订和结构化审查，可以根据 LaTeX 论文项目与图表注释重写或优化正文，并做数字审查、逻辑树检查、缩写一致性检查等工作。
paper-explain-figures 用于解读复杂 Figure，把图像、源代码和人工提示结合起来，生成更适合人类理解的读图说明。
paper-select-journal 则适合在论文接近成稿后辅助选刊，综合 scope、业内认可度、风险信号和近期相似论文，输出带证据链的期刊推荐。

如果你对 AI 参与论文写作这件事感兴趣，建议进一步看看 ChineseResearchLaTeX 的 skills 目录。

第 1 稿之后才是真正写作

但要特别强调一点：第 1 稿的产出快，不等于论文写得快。

一篇好的论文，从第 1 稿到最终投稿版本，要经历的是反复的、有时甚至是痛苦的修改。这个逻辑不会因为有了 AI 而改变，唯一的区别是改稿的对象从“人写的烂初稿”变成了“AI 写的看起来还行但其实空洞的初稿”。

在真实项目里，这种修改往往不是“通读全文，润色一遍”这么简单，而是一次次很具体的局部战斗：今天发现引言的切入点太宽，需要把研究空白收窄；明天发现结果小标题和图的叙事顺序不一致，需要重新调整读者的阅读路线；后天发现方法学虽然写得流畅，但某个数据处理步骤没有交代清楚，必须回到原始分析记录里补证据。AI 可以参与每一次局部修改，但它不能跳过这些局部修改。

所以我现在更倾向于把 AI 论文写作理解为一种“多轮审稿前自我审稿”。每一轮只解决一个问题：这一轮专门看数字和统计描述，下一轮专门看缩写是否一致，再下一轮专门看讨论是否过度外推，再下一轮专门看图注能不能脱离正文独立读懂。这样改起来慢一点，但比让 AI 一次性“全面优化全文”可靠得多。小伙伴们如果真的拿 AI 写论文，建议一定要拆成这种小任务，不要贪图一句 prompt 解决全部问题，哈哈。

AI 写的稿子有一个非常典型的问题：看着流畅，但缺乏锋芒。它倾向于把所有结论都说得稳妥、中庸、四平八稳，导致整篇文章读起来像是一份会议综述，而不像一篇有立场的研究论文。而真正的好论文，是要在某个点上敢于“亮剑”——敢于说“我们的数据支持 A 假说，否定 B 假说”，敢于说“这一现象的机制可能在于 X，这与既往认为的 Y 不同”。

这种“敢于亮剑”的修改，必须由通讯作者或者第一作者亲自来做。AI 没有学术生涯需要承担、没有声誉需要维护、没有 reviewer 会因为某句话来追问它——所以它天然倾向于回避锋利的表述。你要做的，就是在 AI 给出的稳妥稿子上，把那些真正属于你的判断重新“打”进去。

打个比方，AI 写的初稿像一块毛坯料，材料给你备齐了、形状大致是对的，但你必须自己拿起刻刀，把那几个真正决定这件作品价值的地方一刀一刀刻出来。

格式、引用和核查

AI 的杠杆效应

AI 在格式工作上的杠杆效应可能是科研写作的所有场景里最高的——因为这一类工作的特点是规则明确、容错性低、重复度高，三个特征恰好都是大语言模型的强项。

真实投稿项目里有很多碎到让人头疼的东西：同一份稿件要同时生成 PDF 和 DOCX，参考文献在 PDF 里看起来没问题，到了 Word 里可能又要处理跳转、编号和间距；补充表在 Excel 里很好读，投稿系统偏偏要求上传 PDF，于是还要想办法让几十列宽表在 PDF 里不被压成一团；期刊要求补 TRIPOD、ARRIVE、CONSORT 或其他 checklist，你还要逐项说明稿件哪一页哪一段回应了要求。你说这些工作重不重要？当然重要。你说这些工作有没有科学创造性？基本没有。这就是 AI 最值得介入的灰色地带。

我自己在用的几个典型场景包括：

用 AI 把一份杂乱无章的参考文献清单整理成符合某个期刊要求的 bibtex 文件
用 AI 把审稿人的意见拆成结构化的清单，逐条对应到我写的回复
用 AI 把一份中文初稿翻译成符合 SCI 论文常用句式的英文版本
用 AI 帮我把 LaTeX 编译报错的真正原因从一大堆 log 里挑出来
用 AI 把一份 PPT 的图表搬到 Word 报告里，并保持格式统一
用 AI 检查论文不同输出版本之间是否明显不一致，比如 LaTeX 生成的 PDF、Word 导出的 DOCX、投稿系统要求的补充材料 PDF
用 AI 辅助维护投稿 checklist，把期刊要求拆成可勾选任务，再反向检查正文是否真的覆盖

这些工作如果让我自己来做，每一件都至少要花半天甚至一天，而交给 AI 之后通常一两个小时就能搞定。

更重要的是，这种解放是有复利的。当你不再被这些形式工作消耗精力之后，你才有可能在一份本子或者一篇论文上多花一个晚上去推敲那个真正重要的假说，多读两篇关键文献，多跟同事讨论两次实验设计。这才是 AI 在科研写作里真正的价值——不是替代你思考，而是把你从不应该思考的事情里释放出来，让你能在该思考的事情上想得更深。

引用和事实不能偷懒

但格式工作里有一类是 AI 容易翻车的：引用和事实。AI 在生成参考文献时经常会“幻觉”——编出一个看起来很像、但实际上不存在的文献条目，或者把作者、年份、刊物搞错。这种错误一旦混进你的稿子，是非常尴尬甚至致命的。

这也是为什么我在 ChineseResearchLaTeX 里会专门做一些偏“核查”的 skills，而不是只做“生成”的 skills。比如：

check-review-alignment：适合检查综述正文里的引用是否真的支撑当前句子的表述，尽量减少“文献是真的，但引用位置是错的”这种张冠李戴问题
nsfc-ref-alignment：适合检查标书里的 \cite{...}、.bib 条目、DOI 字段和引用语义匹配，先生成报告，再由人决定怎么改
nsfc-qc：适合在标书送审前做一次只读体检，把文风、引用、逻辑、缩写、篇幅这些问题集中扫一遍
paper-write-sci：在论文写作场景里，也会做数字事实核验、逻辑树审查和缩写一致性检查，避免 AI 在正文里偷偷塞进没有来源的数字或过度外推的结论

当然，这些工具只能把风险压低，不能替你承担最终责任。所以即使在格式工作上让 AI 大量参与，所有涉及具体事实的部分（人名、年份、DOI、刊物、卷期页码、实验数字、统计结果）都必须人工核对一遍。这一步不能省，是 AI 写作工作流里少数几个”不能图省事”的环节之一。

更底层的边界

AI 不能替你提出问题

把上面几节的讨论合起来看，会发现一个有意思的规律：AI 越接近“形式”，它越好用；越接近“问题本身”，它越无力。

科学问题的提出、研究假说的形成、实验路径的设计、数据异常时的解读、领域格局的判断——这些都是科研真正的“内核”，它们依赖于研究者本人长期的浸润、直觉和品味。AI 在这一层只能做辅助：帮你查文献、帮你列出可能的解释、帮你做一些初步的逻辑检查。但最后那一锤定音的判断必须由你来做。

如果你试图把这一层也交给 AI——比如让 AI 帮你“想一个科研课题”——结果通常是产出一堆听起来正确但毫无锋芒的题目，做出来既不会失败也不会出彩。这样的课题不值得做。

学术诚信的底线

还有一个边界是任何 AI 写作讨论都绕不开的：学术诚信。

目前主流期刊和基金管理机构对 AI 写作的态度还在快速演化中，但有几条底线已经基本明确了：AI 不能作为作者署名；用 AI 生成的内容必须由人类作者承担全部责任；如果在投稿中大量使用了 AI，最好在 Acknowledgement 或者相关声明里如实说明。

更现实的一点是：不管你在投稿声明里怎么写，最终为这份稿子负责的都是你自己。如果稿子里因为 AI 幻觉出现了不存在的引用、错误的数据解读、抄袭某篇已发表论文的段落，被发现的后果是由你来承担的，不是由 AI 来承担的。

所以“用 AI 写”并不意味着“不用读自己写的东西”——恰恰相反，用了 AI 之后，反而要更仔细地审阅每一段文字。这是 AI 写作里最容易被忽略、但又最重要的一条原则。

真正变强的方式

最后想说一点感受。用 AI 写作几个月下来，我反而更清楚地意识到一件事：AI 不会让一个不会写文章的人突然会写，它只会让本来就会写的人写得更快。

原因很简单：AI 写出来的东西能不能用、好不好用，取决于使用它的人能不能判断。判断一份标书的研究内容是否清晰、判断一段讨论是否切中要害、判断一句方法学描述是否准确，这些都是先于 AI 存在的能力。AI 不会教你这些，它只会放大你已经具备的能力。

所以对于刚进入科研的小伙伴，我的建议是：在你还不能独立判断一篇论文好坏之前，不要急着用 AI 大量代写。先用相对慢的方式，认真改完几篇自己的稿子，让自己对“什么是好论文”有一个真实的感觉。等这种“感觉”建立起来之后，再去用 AI——那时候 AI 才是你的助力，而不是你的拐杖。

小结

科研 AI 写作的边界，可以用一句话概括：形式可以交给 AI，问题必须留给自己。

国自然标书里 80% 的内容是“形式合规”的部分。它们不是科研思想的核心，但也绝不是毫无意义的装饰，而是展示研究细节、证明项目成熟度、完成基础质量控制的门槛。AI 可以帮你把这些章节写得更完整、更规范、更少出低级问题，让你把宝贵的脑力花在那决定生死的几百到一两千字上。论文的情况类似，原始数据和注释准备好之后，AI 可以快速产出第 1 稿，但“好的论文要反复修改”这个底层逻辑不会改变，最关键的讨论部分仍然需要研究者亲自打磨。更实战一点说，论文 AI 写作越工程化，越要有稳定源文件、图表注释、参考文献、投稿清单和可复现构建流程，AI 才越能成为协作者，而不是一个不可核查的文本生成器。格式工作上 AI 的杠杆效应最高，但所有涉及具体事实的部分必须人工核对。

更广义地说，AI 越接近形式越好用，越接近问题本身越无力。它不能替你提出科学问题、不能替你判断数据是否可信、不能替你承担学术诚信的责任——这些恰恰是科研的核心。AI 不会让一个不会写文章的人突然会写，它只会让本来就会写的人写得更快。所以真正的成长路径并没有因为 AI 而改变：先把自己练成能独立判断好坏的研究者，然后让 AI 成为你的放大器，而不是替代品。

---------------
完结，撒花！如果您点一下广告，可以养活苯苯😍😍😍

概览

前言