如何為市場推廣 workflow 編寫一致的 AI 提示詞
一致的 AI 提示詞有四個組成部分:固定的角色定義、有界限的任務描述、必需的輸出格式和明確的約束。缺少任何一個,輸出變化就會太大,無法成為可重複的 workflow。
簡短回答
一致的 AI 提示詞有四個組成部分:固定的角色定義、有界限的任務描述、必需的輸出格式和明確的約束。缺少任何一個,輸出變化就太大,無法成為可重複的 workflow。
一致的 AI 提示詞在每次運行時產生大致相同質素的輸出,無論是誰在運行或是哪天。大多數提示詞做不到這一點,因為大多數提示詞缺少四個結構性組成部分中的至少一個。
這裡是這些組成部分及其各自重要的原因。
為什麼 AI 輸出每次都不同?
輸出變化是因為提示詞留下了模型用自己的預設值填充的空白。這些預設值不是隨機的,但也不是你的。它們根據輸入的表達方式、模型碰巧從訓練中調出的例子以及任務描述有多模糊而變化。
當你寫「總結這個活動簡報」時,模型必須決定:摘要應該多長?什麼格式?哪些要素最重要?什麼級別的技術語言合適?它默默地做出這些決定,不告訴你。每次結果不同是因為模型每次都在做出不同的隱含選擇。
解決方案不是更好的模型。而是更完整的提示詞。
一致提示詞的四個組成部分是什麼?
1. 角色定義。 告訴 AI 對於這個任務它是誰。不是「你是市場推廣專家」——那太模糊了。類似於:「你是一名高級付費媒體分析師,正在為每月審核 12 份此類報告的品牌總監總結活動績效數據。」這錨定了語調、細節水平和假設的知識。
2. 有界限的任務描述。 精確描述你要求什麼。「總結附帶的活動數據」是無界限的。「寫一份三段式績效摘要,涵蓋:按點擊率排名最高的創意素材、按每次轉化成本排名最高的受眾群體,以及一個需要品牌總監審核的標記」是有界限的。界限消除了模型代替你決定範圍的需要。
3. 必需的輸出格式。 指定結構。需要標題嗎?項目符號?特定字數?如果輸出進入另一個文檔或系統,格式不是可選的。明確說明:「以純文本輸出,包含三個帶標籤的部分:創意績效、受眾績效、需要採取行動。」
4. 明確的約束。 輸出不應該做什麼?這是大多數人忘記的組成部分。「不要包含沒有上下文的原始數字。不要推薦媒體計劃的更改——只標記,不開處方。不要使用『值得注意的是』或『總之』這樣的短語。」約束防止模型用你不想要的習慣來填補空白。
一個具體例子:活動績效摘要
這裡是同一個任務用兩種方式寫的例子。
模糊的提示詞:
總結本週的付費活動績效。
輸出會變化。有時是三句話,有時是十二個要點。有時標記 CPL,有時標記 ROAS。有時提出品牌總監會忽略的顯而易見的建議。收到這個的人必須做額外的工作來找出什麼是相關的。
結構化四組成部分提示詞:
你是一名高級付費媒體分析師,正在為每週審核 12 份報告且每份只有五分鐘閱讀時間的品牌總監總結每週活動績效數據。
為以下數據寫一份績效摘要。恰好涵蓋三個領域:(1)本週按點擊率排名最高的創意素材,與過去四週平均值相比;(2)按每次轉化成本轉化率最高的受眾群體,包含每次轉化成本數字以及是否高於或低於目標;(3)需要品牌總監注意的一個事項,用一句話描述。
格式:三段短段落,每段以粗體標籤開始:「創意」、「受眾」、「標記」。總長度 150-200 字。
不要包含沒有上下文的原始數字。不要推薦媒體計劃的更改。不要總結整個活動——只涉及這三個領域。避免填充短語如「值得注意的是」或「總體而言」。
[以下為活動數據]
第二個提示詞的輸出在各次運行中幾乎相同。不是因為模型更聰明——而是因為模型沒有空白可以用自己的預設值填充。
如何知道你的提示詞是否有效?
在類似的輸入數據上運行相同的提示詞三次。如果輸出在結構上相同——相同的部分、相似的長度、相同的細節水平——那麼提示詞是一致的。如果結構在各次運行中變化,四個組成部分中有一個缺失或不夠具體。
也可以讓別人來運行它測試。將提示詞和數據交給他們,不作解釋。如果他們得到與你不同的輸出,提示詞有一個你沒有記錄的隱含假設。
這在構建 Prova 中是如何體現的
不一致是我在構建 Prova 的衝刺審核系統時必須解決的第一個真正的技術問題。我有關於強大衝刺成果物是什麼樣子的良好標準,但 AI 審核員對類似的提交產生不同的評估,取決於審核提示詞被調用方式的小變化。
解決方案是在每個審核提示詞的開頭添加一個結構化上下文塊——不僅是標準,還有有界限的任務、輸出格式和關於審核員應該和不應該評論什麼的明確約束。回過頭來看很簡單。在不一致結果的模式迫使我去看它之前並不明顯。
那個經歷就是從提示詞走向第一個有用的切片文章的內容——「這有時有效」和「這每次都有效」之間的差距。
Cheers, Chandler
