引言:从“请求”到“指令”
在与AI的互动中,我们输入的文字——即“提示词”(Prompt)——决定了输出的质量。
大多数人停留在发出简单“请求”的层面,例如“写一个关于太空探险的故事”。这种方式在随便娱乐的情况下能满足基本要求,但是AI味拉满,泛泛而谈、缺乏个性,无法满足创作中的自我表达。
2023年刚出现大语言模型的时候,就有人提出过“超级提示词”,整篇提示词都如同一篇小作文,冗长,晦涩,但详尽,精确。
一个日常的提示词是一个请求,而一份超级提示词是一套详尽、结构化的“任务简报”。明确告诉AI“做什么”,同时精确定义了“如何做”、“以什么身份做”、“遵循什么风格”以及“利用哪些背景信息”。
掌握超级提示词如何撰写,意味着对AI的使用水平,正式从“仅限娱乐”转变为“能够生产”。这一点到了2025年也不会过时。因为即便不应对AI,你在带领团队做任务的时候,你也需要给你的团队颁发“任务简报”,告诉每个人 “做什么”、“如何做”、“注意事项”等。
本帖旨在从写作角度,在[图灵茶馆]为各位提供适合于一套从核心理念到具体实践的完整方法论。我们将首先通过一个具体的实例,直观展示超级提示词的变革性力量,然后系统性地传授构建它的具体技巧与底层原则 。
第一章:超级提示词的力量——一个实例的启示
为了让各位直观理解超级提示词的作用,让我们设想一个具体的创作任务:
为一部名为《问道寻仙》的玄幻修仙小说撰写其中一个章节
一个新手如果想用AI去写,可能会写成:“ 写一个关于修仙者在门派藏经阁中探索的章节。 ”
这样的指令当然也能生成结果,但给予了AI无限的自由度,也因此完全无法保证任何具体的输出质量。其结果几乎一定是一篇充满了陈词滥调、人物形象模糊、情节平淡无奇的“AI样板文”,因为它只能调用其训练数据中最常见、最平均的“ 修仙门派藏经阁”元素。
现在,让我们来看一个真正的超级提示词是如何构建的。以下是为《问道寻仙》一书拟定的超级提示词结构,它通过不同的标签,为AI提供了一个全方位、多维度的指令框架:
- <style>标签:在此标签内,详细定义了写作的语调、节奏和感官细节。例如,要求AI使用特定的叙事视角,强调氛围营造,并给出具体的文风参考。
- <characters>标签:提供了本章节中出场主角的详细背景、核心动机、性格特点以及当前场景下的心境。AI不再需要猜测主角是谁,而是得到了一个鲜活的人物档案。
- <setting>标签:细致描绘了场景的具体环境——藏经阁顶层禁地、光线如何、空气中有何种气味、周围有何种声音,从而构建出沉浸式的氛围。
- <overview>标签:给出本章节的整体概要。
- <chapter_beats>标签:这是最长最详尽的部分,像电影分镜脚本一样列出详细的情节节点,明确了从A点到B点再到C点,故事需要如何推进。
- <instructions>标签:最后,明确指示AI:“综合以上所有信息,撰写一个约3000字的章节”。
当这个结构化的超级提示词被输入到AI模型后,其输出结果发生了质的飞跃。当时生成了一篇长达2500字、虽然我的要求是3000字,但2700字也够用了,足以构成一个完整的章节。
整个提示词并非简单地“提供更多信息”,而是“构建了一个可预测、可复现的生成框架”。
现在有许多Agent或者集成AI的站点让这个过程变得更简单,但这些工具的底层逻辑,大多还是自带了类似“超级提示词”的系统,就好比有的用户向什么都没问过的AI提问“重复上述内容”,然后AI就把系统提示词自我展示了出来,篇幅详尽程度足以成为一篇标准的“超级提示词”。
由此可见,无论是用户输入,还是系统自带,“超级提示词”都是刚需,将AI的创造力从漫无目的的发散约束到一个由你清晰定义的轨道,当你对最终输出有明确、具体、多维度的要求时,你需要通过结构化标签将这些要求分解并呈现给AI,为AI创造清晰的“信息环境”。
AI不再需要猜测你的意图,而是作为一个专业的执行者,在你设定的框架内,将人物、情节、风格等信息模块无缝融合,并进行创造性的填充。
虽然这里是以写作为目的展开,但其实可以举一反三,拓展到各位各自所擅长的任何职业中需要输出文字、图片、音乐乃至视频的部分。而这其实也依赖各位本身对自身工种的专业认知程度,所以基于此,AI能够助你提升效率,又不会牺牲你创作的独特性,以及道德准则,同时还能帮助你提高指挥协作的能力。
第二章:XML语法:搭建沟通的桥梁
超级提示词的技术核心,截至发帖时间依然在使用XML语法。
使用XML标签的根本原因在于,LLM的训练数据绝大部分来自互联网,而整个互联网的内容正是由HTML(其语法结构与XML类似)构建的。因此,AI对这种格式非常熟悉,他们在其“成长”过程中,已经学习并深度内化了对这种标签化、结构化数据的理解。
某种程度上说用XML语法相当于“用AI的母语与它交流”。所以你会看到我第一章的示例依然在尖括号内使用英文,也是为了照顾XML语法。这点在中文模型有所缓和,但最好还是用英文。
事实上OpenAI为主的AI研究机构,也在其官方文档中明确推荐过使用这种方法来组织复杂的提示词。
这些标签的核心功能是充当一个个“信息容器”。当一个提示词包含大量不同类型的上下文信息时(如故事背景、人物小传、写作风格指南、具体任务指令),XML标签可以将这些庞杂的信息分门别类地装入不同的“ 信息容器 ”里。
这使得AI能够清晰地识别每一部分信息的功能和优先级,而不是面对一团混沌的文本。
XML标签的格式是这样的:用尖括号包裹一个词(如<instructions>),然后是你的内容,最后用一个带斜杠的相同词语结束(如</instructions>)。这是一个巧妙的方法,可以将信息分装在不同的“容器”里,方便AI理解。
例如,你可以创建一个“指令”容器:
<instructions>
这里写下你的具体指令。
</instructions>
你也可以为“风格”创建一个容器:
<style>
这里描述你想要的写作风格。
</style>
这种方式能让你的提示词井井有条,帮助AI更好地理解你的故事。
下表提供了一个相对通用的XML标签模板,各位可以作为一份检查清单来用,确保在构建提示词时不会遗漏关键信息,从而将抽象的“提供上下文”概念,具体化为一个个功能明确、需要填充的模块:
| 标签 | 功能描述 | 示例内容 |
| <role> 或 <identity> | 定义AI的角色和身份,将其思维限定在特定专业领域。 | 你是一位经验丰富的玄幻小说家,擅长营造神秘氛围和描写细腻的内心活动。 |
| <task> 或 <instructions> | 明确、具体的核心任务指令,是整个提示词的行动核心。 | 请根据以下提供的上下文信息,撰写小说《问道寻仙》的第一章,要求字数在2500至3000字之间。 |
| <context> 或 <background> | 提供任务所需的宏观背景信息,如故事大纲、世界观设定等。 | 故事发生在一个名为“云荒”的修仙世界,修炼境界分为练气、筑基、金丹、元婴等。人族与赛博坦对峙千年,主角所在的青云宗是正道三大门派之一... |
| <examples> 或 <sample> | 提供AI需要模仿的风格、格式或内容的具体范例。 | [此处粘贴一段符合期望风格的文字样本,约500字] |
| <style> | 对写作风格、语调、词汇选择、句子结构等提出详细要求。 | 使用第三人称有限视角。多用感官描写,避免陈词滥调。句子结构长短结合,营造紧张感。 |
| <characters> | 提供场景中出现的角色的详细信息。 | 主角:苏清婉,青云宗百年不遇的天才,但身负血海深仇,寻找失传禁术。性格貌似清冷,实际上是个搞笑角色... |
| <constraints> | 列出明确的限制和禁止项,为AI的行为划定红线。 | 禁止使用过于现代的词汇。避免角色独白超过三句话。不要在这一章揭示反派的真实身份。 |
| <format> | 定义输出的格式要求。 | 请以Markdown格式输出。章节标题使用二级标题。对话部分使用标准引号。 |
举一反三,在撰写广告文案时,如果要求的风格特别明确,可以创建一个<examples>标签,并在其中放入几个,十几个乃至几十个已被验证为成功的广告文案范例(一般创建一次后,后续复用可以将这些案例复制粘贴,不用重复撰写)。
然后在<instructions>标签中,明确要求AI模仿这些范例的风格、结构和说服力,为新产品创作文案。
这种做法远比模糊地要求“写得有吸引力”要有效得多。
第三章:提示词工程的核心法则
掌握了XML这一结构化工具后,我们必须理解驱动其有效性的三个核心思想原则。
这三大法则是构建任何高效提示词都必须遵守的底层逻辑。
法则一:具体明确
这是所有提示词技巧中最重要的一条。AI不是人类的代笔作家,它不具备通灵般的能力来推断你未言明的潜在意图。
我见过很多人在抱怨:“我无法从AI那里得到我想要的东西,它就是不按我的要求做。”然而当审视他们的问题时,可以发现他们根本没有清晰地告诉AI他们到底想要什么。
AI不同于代笔写手。一位代笔写手或许能根据你的大纲,凭借自己对故事创作的理解,推断并创作出一个精彩的场景或故事。但AI做不到,除非你在提示词中明确地阐述了你的想法。
所以
你必须在提示词中明确、详尽地告知它你想要的一切,包括场景中的具体细节、角色的心理弧光、故事的整体大纲等等。
AI不会凭空知晓这些,它无法自己编造一切。你必须为它提供信息。
当你的输入是一个模糊的想法时,比如“写一个很酷的玄幻故事”,AI缺乏独特的创意锚点。它的“文字概率生成”的底层逻辑,注定了在缺乏引导的情况下,只能访问其庞大的训练数据中关于“ 玄幻故事”的“平均”或“最常见”的模式,并生成一个统计上最可能的结果。这便是那些被批评为陈旧老套、缺乏新意的“AI味”“AI样板文”的根本来源。
相反,当你的输入是一个清晰、具体的概念时,例如“写一个赛博朋克背景下的玄幻故事,主角是一位侦探,他依靠引导符咒与阵法的来破解企业AI的防火墙”,AI就获得了多个独特的、具体的元素。它会将这些元素作为锚点,在其知识库中进行创造性的连接和组合,从而生成高度定制化、真正放大了你最初创意火花的内容。
AI协作创作所能达到的质量上限,必定取决于人类协作者自身的思考深度和表达清晰度,这是大模型的“文字概率生成”的底层逻辑所注定的。
一个技艺高超、思维清晰的人类与AI的组合,其成就永远会超越单独的AI。
法则二:少即是多
如果你只看完法则一,则可能陷入一个常见的误区,也就是认为提供给AI的信息越多越好,甚至将整本书或大量无关的背景资料直接塞入提示词中。
这种做法实际上会“稀释”你的核心指令。
首先,这会显著增加你的使用成本(输入也是计算token的)。其次,这种提示词就像让AI在大海捞针,效果只会适得其反。
提示词中的每一个词,要么是传递有效信息的“信号”,要么是干扰理解的“噪声”。
当提供一本100000字的小说原文作为背景时,其中与当前任务直接相关的“信号”(如关键情节、核心人物关系)会被大量无关的“噪声”(如次要场景的琐碎描写、无关紧要的对话细节)所淹没。尽管现代AI拥有巨大的上下文窗口,但其“注意力”仍然是有限的资源。在处理海量文本时,它可能会错误地分配权重,从而忽略了真正重要的指令或上下文。
更有效的方法是提供一份经过精炼的,分章节的摘要。在这个摘要中,每一句话都是高价值的“信号”,直接指向故事的核心脉络。AI可以轻松地处理这些高度浓缩的信息,并将其作为生成新内容的坚实基础,让AI更好地抓住重点的同时还能显著降低API调用的成本(重复强调,输入也是计算token的,因为上下文的成本是指数递增,10万字以上的一次token指令成本非常高昂)。
提示词工程师的核心工作之一,就是对提供给AI的上下文进行预处理、提炼和总结,以最大化信噪比(信号与噪声之间相对强度),确保AI的注意力能够集中在最关键的信息上。
法则三:化整为零
基于法则二,不要期望AI能够一步到位地完成一个宏大而复杂的任务,比如“为我这本书写一个五万字的全文”。即使是当前最强大的模型,他的输出能达到5万字这么长,在处理这种一次性的复杂指令时,也常常会出错,例如遗漏章节、搞错事件顺序或错误地编号。
没办法,当前的AI注意力依然捉急,不要以为只有人存在注意力这个问题。
大模型在处理任务时,当一个指令中包含过多的步骤和需要同时处理的上下文,这些内容超出其当前任务处理能力的上限,那么他在幻觉的作用下,就会导致性能下降和错误率上升。
想象一下,如果你的指令只占整个提示词的1%,你不能指望这1%的内容能被AI记住,并被赋予比其他99%内容更高的权重。
如果能将核心指令放在“系统提示”(System Prompt)中(这一点Google Ai Studio就很好),让它时刻铭记。你就可以用不同的方式重复同一个任务。
如果系统提示词无法编辑,可以在设定风格时这样做:我提出一个要求,然后用另外两种不同的措辞重复一遍。这样可以确保AI真正理解我想要表达的意图
对于工程本身,正确的做法是,将宏大的任务分解为一系列更小、更独立的子任务。
例如,与其要求AI一次性总结整本书,不如让它逐个章节地进行处理:“总结第一章,并提取其中的角色信息和世界观设定。”完成之后,再处理第二章,以此类推。
当所有章节的浓缩信息都准备好后,再让AI基于这些结构化的信息执行更复杂的任务,比如“根据以上所有章节的摘要,创建一个贯穿全书的角色弧光分析”。
这种与AI协作的最佳模式是“流水线作业”,将一个宏大的目标(如写一本书)分解为:构思 -> 大纲 -> 章节节点 -> 场景草稿 -> 章节正文 -> 修订。每个阶段都是一个独立的、定义清晰的子任务,前一个阶段的输出成为后一个阶段的输入。
这种模式不仅更符合AI的工作方式,也更贴近人类本身的高效创作流程。
第四章:适配给AI创作时构建高效提示词的实用公式
在理解了核心原则之后,我们需要一个能将这些原则固化下来的实用工具。
曾经在2023年11月,新加坡组织举办了首届 GPT-4 提示工程(Prompt Engineering)竞赛。最终的冠军提出了CO-STAR这么一个框架:
Objective(目标)
Style(风格)
Tone(语气)
Audience(受众)
Response(响应)
这套理念在今天依然比较科学,也可以进行多种适配性调整,比如我觉得按照小说创作的需求,可以简化调整为FITS:
Identity (身份)
Task (任务)
Style (风格)
I - 身份 (Identity): 赋予AI一个具体的角色或身份,是缩小其庞大通用知识库、使其专注于特定领域的有效方法。指令如“你是一位荣获普利策奖的新闻调查记者”或“你是一位畅销的硬科幻小说作家”,能够引导AI调用更相关的知识和语言风格,从而产出更专业的内容(那个时候有人调侃这是一种“麻醉”,然而实际上对于通用大模型,“身份”能让AI更容易进入状态)。
T - 任务 (Task): 这是FITS框架中最直接的部分,即用清晰、无歧义的语言,准确地告诉AI需要完成的具体工作是什么。
S - 风格 (Style): 在写作时,你通常希望AI以特定的方式来写作。这部分就是用来定义风格的指令。你可以要求它“多使用展示,而非说教”,甚至可以给它几千字你自己的作品作为模仿的范本。
你可以参考本文提到的FITS框架,也可以用前文提到的CO-STAR框架,甚至可以自我创建框架,但无论使用任何框架,根本目的都是创建一个思维层面的“梯子”或者“脚手架”。这个框架能够强制你在与AI沟通之前,先系统性地梳理清楚自己的需求。
当你脑中只有一个模糊的任务时,你凭感觉写下的提示词很可能遗漏关键要素,比如忘记定义AI的角色或期望的输出风格,这自然会导致AI因信息不全而产生平庸或错误的输出。
而当你遵循一种稳定的框架进行思考时,他会被引导去回答一系列关键问题:我希望AI扮演什么身份?输出需要遵循怎样的框架?核心任务究竟是什么?我偏好的风格是怎样的?
通过回答这些问题,你在系统性地构建出一个信息完备的提示词的同时,AI因此获得了完成高质量工作所需的所有必要信息,输出质量自然显著提升。
可以说,一种稳定框架的价值在于“过程即结果”。遵循这个框架的过程,本身就是一个将模糊想法清晰化、结构化的过程。
这个框架与其说高提示词的质量,不如说能稳固使用者自身的思维质量。
第五章:高级技巧与迭代优化
掌握了基础框架和核心原则后,要将AI的输出效果推向极致,就需要进入一个不断实验、迭代和优化的动态过程。卓越的AI输出并非一蹴而就,而是通过一系列高级技巧精心打磨的结果。
技巧一:实验,测试,迭代
提示词工程不是一门精确科学,而是一门实验艺术,需要大量的测试和改进才能找到最优解。尤其是对于高度定制需求的文创而言。
尝试不同的LLM:每个大型语言模型都有其独特的优势和劣势。例如对于通用大模型,GPT或者Deepseek可能在头脑风暴和创意生成方面表现出色,Kimi可能更擅长长文本写作和细致的风格模仿,而Gemini可能在编辑和事实核查方面有其长处。一个在某个模型上效果不佳的提示词,换一个模型可能会有截然不同乃至惊人的表现。你可以通过问询其他人初步了解,但最好的方式还是花时间亲自去体验和尝试不同的模型。
持续测试与优化:许多人抱怨AI效果不好,往往是因为他们测试得不够充分。那些被轻易识别出的“AI味”“AI样板文”,通常是未经优化的、简单的提示词所导致的结果。只要多花一点时间和精力去不断测试、迭代和改进提示词,你就能得到完全不像他们口中所谓的“AI味”的作品。所以,永远不要停止测试——无论是测试你的提示词、测试不同的模型,还是测试不同的参数。这是本文能给你的最重要的建议之一。
这要求你具备一种“系统思维”。你需要理解,“提示词”并不仅仅是输入的文本,而是一个由(文本 + 模型 + 参数)构成的完整系统。优化最终结果,需要对这个系统中的每一个变量进行调试和探索。
技巧二:运用分步流程
前面提到的“化整为零”比较粗浅, 概念化 ,这里进一步在创作流程中具体化。
其核心思想是:从一个小的核心概念开始,通过与AI的协作,逐步扩展和丰富,最终形成一个复杂的成品。
从简单的结构中生长出复杂的细节。
一个典型的创作流程可以是:
2. 故事梗概:将头脑风暴的成果整合成一个连贯的故事梗概。
3. 章节大纲:基于梗概,进一步扩展成详细的分章节大纲。
4. 场景简报:针对某一章节,撰写出更细致的场景简报,包含情节节点、人物动机等。
5. 完整章节:最后,利用场景简报作为超级提示词的核心内容,让AI生成完整的章节。
这个过程就是从一个小点开始,像分形一样拓展为完整的分部流程,一步步扩大,直到完成整个作品。
在每一个扩展阶段,你都可以进行干预、修正和引导,确保最终的成品始终符合最初的创意愿景,而不是任由AI偏离航道。
技巧三:花时间与AI互动
不要期望一个完美的提示词就能一劳永逸地解决所有问题。最优秀、最独特的结果,往往来自于与AI的反复对话和交流。
在和聊天AI对话时,你可以针对性的进行多轮对话。虽然不建议在正式写作时使用,但在构思大纲或头脑风暴时,建议频繁这样做。比如,我会说:“嗯,我喜欢这个想法,但我们能多加入一点这个元素吗?”或者“你能用这种方式重写一下吗?”之类。
结合我们前面已经提到的“文字概率生成原理”,当你仅仅发出一个一次性的提示词时,AI会根据其概率模型,生成一个统计上最可能的结果。这种结果虽然通常是合格的,但也可能显得通用和缺乏惊喜。
然而,如果你与它进行多轮互动,你就加入了更多属于你自己的、人性的创造力,这使得最终的产出独一无二,几乎不可能被复现。
提问、要求重写、提供具体反馈,就可以形成一个强大的反馈循环。在这个循环中,人类的创造力、品味和独特视角被不断注入到生成过程中。每一次交互都在引导AI偏离其“平庸的平均路径”。
最终,经过这样反复打磨而成的作品,是人与机器智慧共同的结晶,其独特性和深度是任何一次性提示词都无法比拟的。这种交互模式,是对抗“AI味”倾向的最有效途径。
第六章:自动化工作流
在今天,当我们拥有各种先进的AI写作工具时,手动编写复杂的超级提示词还有意义吗?
通过前面的论述,很明显,答案是肯定的,但这需要我们理解超级提示词已经发生了演进:它的核心原则已经从一种用户技巧,内化为了这些先进工具的底层逻辑。
在创作的每个阶段都手动复制、粘贴和修改包含大量上下文的超级提示词,是相当低效的。然而,尽管他不再像过去那样频繁地在聊天框中手动编写超级提示词,但其核心原则却无处不在。
可惜他是英文网站,不支持语言切换。
国内的话,类似“星月写作”“蛙蛙写作”“灵犀速写”等有着不少的效仿者,他们也承载着类似的职能,虽然提示词是用户提供的导致良莠不齐,功能上也较Novelcrafter有所欠缺,但也具备着一定的可定制性。
(关于这点我一直觉得目前的国产AI写作软件没有学到精髓,他们更像是一个token贩子,而缺少真正的作为软件自身的技术。比如,Novelcrafter能自动识别正文中出现过的词汇,自动关联到词条库,同时能给这个词条提供进展节点,根据进展节点的前后章节选择,在给AI发送指令时提供不同的同名词条,还能判断场景节奏,提示词协助撰写等,他不靠大模型收费,而是自身系统功能性过硬;比如,SudoWrite虽然功能性和Novelcrafter比起来差很多,但他存在独门技术壁垒——人家是真的有一个完全自研,自训练的muse1.5大模型,完全,纯粹为小说创作服务的大模型,在写初稿的时候特别厉害,比某C要强大的多)
如果不易脱这些软件,也可以自我搭建自动化工作流(比如使用Make.com)。
对Agent有一定理解的高级用户,会创建自己的自动化流程,例如,一个流程可以被设计为:
将这些信息动态地填入一个预设的、包含<outline>, <instructions>, <prose_style_examples>等标签的超级提示词模板中
通过API调用AI模型生成内容,最后将结果存回另一个文档。
整个过程无需手动干预。
用户需要便捷地获得高质量、高可控性的AI生成内容,但手动编写包含所有必要上下文的超级提示词过于繁琐。因此,软件开发者和高级用户将超级提示词的构建过程“自动化”和“后台化”。
工具通过图形用户界面(GUI)让用户输入核心信息,然后在后台自动整合所有相关上下文,动态生成一个完美的超级提示词并发送给模型。用户的体验得到了极大简化,但其背后依然是超级提示词的强大原则在驱动。
因此,在今天学习超级提示词的构建原理,不仅是为了在聊天框里写出更好的指令,更重要的是,你能够深刻理解现代AI工具的底层工作逻辑。这种理解将赋予你以下优势:
2. 在现有工具无法满足你的独特需求时,有能力自己构建定制化的自动化工作流。
3. 能够辨别哪些AI工具是真正经过精心设计的(还是不得不提Novelcrafter),而哪些只是对API的简单封装。
可以说,掌握了这些逻辑,也许你也可以作为一名提示词工程师去卖提示词赚点小钱了。
结论:请成为AI时代的架构师
本文从一个具体的实例出发,系统性地介绍了构建超级提示词的技术(XML标签)、三大核心法则(明确性、少即是多、化整为零)、一个实用的构建框架(FITS)以及一系列从优秀到卓越的高级优化技巧。
最终,我们揭示了超级提示词的本质演进——它已从一种需要手动实践的技巧,升华为驱动先进AI应用和自动化工作流的核心架构思想。
掌握超级提示词,不仅仅是学会一项新技能,更是完成一种思维模式的转变。这意味着,我们与AI的关系,从向一个神秘的“许愿池”祈求灵感,转变为像一位建筑师一样,为AI的创造力“制定规则”和“搭建框架”;从一个被动的请求者,转变为一个主动的、能够设计和指挥复杂人机协作流程的“架构师”。
希望每一位读者能够运用本文提供的框架和技巧,构建属于自己的第一个超级提示词。
希望能够帮助各位作家及潜在作家能够将AI作为一种高效的生产力工具,既能提升效率,又不会牺牲创作的独特性和道德准则。
https://bbs.nga.cn/read.php?tid=45036938
- 本文固定链接: https://www.fengshen.cn/2025/11/如何构建超级提示词来正确地使用ai写作/
- 转载请注明: fengshen 发表于 Dream of Wind | 一梦风神
