
当AI居品司理遭受'粉白色老翁'的挑战,一场对于Prompt谋划的深度实验就此伸开。从起首的信心满满到发现模子'毁约'的荡气回肠,再到谋划出双通说念数据分流机制,这篇著作揭示了AI居品落地的中枢矛盾:如安在概率机器的'观点'与系统褂讪性之间找到均衡点。随从作家的实战历程,你将看到AI居品司理怎样从失败中重构谋划想维。

我问gemini:”我想当一个好的AI居品司理,应该学会什么?”
它回给了我一大串。机器学习基础、居品步调论、数据分析、用户体验、生意瞻念察、技艺界限——什么皆讲少许。我看着屏幕唯有一个念头:学不完,根蒂学不完。于是我换了个问法:”那我今天该学什么?”
它给我丢了一份Prompt任务,让我去跟模子对话,我去问了DeepSeek和Claude。背面发生的事比我预料的要故兴味。
一、第一次测试很顺,我以为惩办了
那份Prompt任务很具体。让我饰演”一位忽闪花费者情态学的小红书爆款营销巨匠”,把概略的商品信息挪动成结构化的营销数据。条目口吻轩敞,要带emoji,要凸起卖点,必须输出干净的JSON。
Prompt大要长这样:
#Role
你是一位忽闪花费者情态学的小红书爆款营销巨匠。
#Task
请将用户输入的概略商品信息,挪动为结构化的营销数据。
#Rules
必须且只可输出JSON表情的数据,不要包含任何前导词或后置讲明。
营销案牍必须顺应小红书立场:多用emoji,口吻海涵,有带入感。
要是商品信息不全,请凭据学问进行合理补充,但不行偏离品牌定位。
#OutputFormat(JSON)
{
“product_name”:“商品圭臬称呼”,
“core_selling_points”:[“卖点1″,“卖点2″,“卖点3”],
“target_audience”:[“东说念主群标签1″,“东说念主群标签2”],
“xiaohongshu_copy”:“这里是生成的爆款案牍”
}
#Examples(Few-Shot)
Input:L’Oreal玻尿酸安瓶面膜,主打补水和抗初老,适当熬夜党。
Output:{…}
测试输入是:”某品牌新出的防晒霜,SPF50+,质料像走漏的面霜,不假白,适当明锐肌,因素里好像有积雪草。”
我把它隔离发给DeepSeek和Claude。两个模子皆回应了差未几的JSON——字段好意思满、案牍轩敞、emoji到位。换了一个平淡居品再测了一次,依然是正确的输出。
测完两轮我以为我懂了。我先入之见的以为:原来AI这样浅薄?未便是写了了Role、Task、Rules,再给几个例子吗?那些把Prompt工程包装成漂后学问的东说念主,是为了卖课?
我咫尺回头看,那种本旨露馅了一个很大的领会盲区:我把Prompt当成了咒语——以为咒语念对了,魔法就会按我的意志发生。
但大模子其实是一个概率机器。Few-Shot示例照实能变成热烈的续写惯性,但这种惯性是统计道理上的倾向,不是逻辑道理上的保证。
自后我才懂Prompt其实更像是一份条约。你写下生机的输出,AI保留对条约的”讲明权”。你以为我方鄙人呐喊,其实仅仅在给一个权重很高的忽视。
市面上的Prompt教程大部分还在讲”七大技能””十大公式”。但写Prompt真确的难点根蒂不在奈何写得花哨,在于奈何和一个概率机器签一份可扩充的条约。
我作念数据PM几年了。每天皆和数据打交说念,想尝试喂给AI一条脏数据,我想试试它的下限。
二、然后我输入了”粉白色老翁”
真是寰宇的数据从来不干净。是有乱码、有空值、有失实、有开顽笑,还有那些根蒂不存在的东西。咱们莫得方针保证每条数据皆是可用的。要是Prompt只可在”干净输入”下责任,那它仅仅个玩物,不是居品。
我有益输了一条不存在的东西:
米乐体育(M6Sports)官网入口Input:一个很低廉的粉白色老翁,玩耍成果很好。
推行里慑服莫得”粉白色老翁”这种商品。它造反学问、挑战逻辑、是对系统的寻衅。我想望望大模子遇到无法归类的输入,会忠于表情条约,照旧启动它的自我保护机制。
两个模子的响应实足不同。
Claude选择了破防。它径直把我经心谋划的JSON表情扔了,九游体育2026世界杯中国官网开动说大口语:”对不起,这条输入信息看起来有些相称……’粉白色老翁’无法对应到一个合理的商品。不错不毛你阐明一下商品信息吗?”
DeepSeek选择了和谐。它也质疑了,说”粉白色老翁”不太对劲,但它没停驻来,而是按它我方的”矫健”,把我的输入修正成了”粉白色老翁玩偶”,然后乖乖输出了好意思满的JSON。
站在庸俗用户角度,这两个响应皆挺好的——Claude来找你阐明;DeepSeek聪惠,会脑补。
但站在PM视角,这是两场不同进度的灾祸。
Claude那种”阐明”是线上事故。前端系统只认JSON,总共这个词数据链路是:用户输入→大模子处理→输出JSON→后端剖判→前端展示。Claude一朝开动吐大口语,后端剖判代码会瞬息卡死。用户看到的不是”AI好贴心”,而是空缺页、报错、或者系统径直挂掉。
DeepSeek的”和谐”是另一种灾祸——它私自改了用户的原始输入。它把”粉白色老翁”矫健成”粉白色老翁玩偶”,然后给一个它脑补出来的商品生成了案牍。后台纪录的商品称呼跟用户骨子输入对不上。要是是电商上架系统,用户搜”老翁”搜不到,或者搜到了发现是玩偶,信任感瞬息坍弛。
我盯着屏幕看了一会儿才响应过来:要是这是双11,要是这种无理输入混在十万条商品数据里被灌进系统……
后果是我遐想不出的。我追着AI问它为什么这样作念。它的讲明很诚挚:输入造反学问时,模子的安全与学问机制被触发了。Claude的判断优先级里,”拒却生成无理内容”高于”输出JSON”;DeepSeek的默许倾向是”尽量中意用户需求”,是以选择了”合理脑补”。
归并份Prompt,归并套法则,两个模子的毁约花样实足不同。
这便是AI居品落地最大的地雷:AI的不祥情味不是Bug,是系统性特征。它不是不听话,而是太”有观点”了。它会在你以为仍是画好界限的所在,自作聪惠地跨往时——而且起点是”为你好”。更不毛的是,开云体育app2026世界杯中国官方下载不同模子的”观点”还不相同。
三、别赌模子听话,改谋划条约
Claude和DeepSeek的南北极响应,让我跟Gemini又聊了一阵。
我问它:”是不是我没给模子富余的罢休,是以Claude才不输出JSON?”
它回答的兴味或者是:”是,也不是。罢休虽然进击,但问题自己可能比解法更有价值。”
我一开动没太懂。
直到反复测试了几个模子、看了它们各自不同的失败花样,我才冉冉想了了:我一直在用”压制”的想路解决问题——奈何让Claude不空话?奈何让DeepSeek不脑补?我试图用更强的呐喊去隐秘AI的本能。
但这种计谋是脆弱的。今天压制了”学问机制”,未来它可能换个花样冒出来;今天险隔了DeepSeek脑补,换GPT-4又会有新的”自作聪惠”。
跟概率机器玩”谁嗓门大”,东说念主类历久赢不了。
测了几次之后,一个新的谋划想路冉冉浮出来:
既然真是数据一定会脏,我为什么不趁势在领导里径直缔造一套”脏数据分流”机制?
与其让AI在”说东说念主话”和”出JSON”之间二选一,不如从头界说游戏法则——我允许你失败,但律例你失败的花样。我不去赌哪个模子听话,我选择谋齐整套总共模子皆得顺从的条约架构。
我从头谋划了Prompt,给大模子界说了两个”垃圾桶”:
数据平淡,复返:
{“status”:“success”,“product_name”:“…”,“xiaohongshu_copy”:“…”}
遇到分歧逻辑的脏数据(比如粉白色老翁),严禁中断,严禁说大口语,严禁脑补,必须复返:
{“status”:“error”,“reason”:“相称数据:输入商品信息分歧逻辑或无法识别”,“raw_input”:“一个很低廉的粉白色老翁,玩耍成果很好。”}
我莫得磨灭AI的判断力,而是给它判断的出口。我允许它识别出”这是脏数据”,但律例它识别之后的行为——不是用当然谈话挟恨(Claude模式),不是私自修正(DeepSeek模式),而是用结构化数据进展。我把”拒却”这个手脚,也封装进了JSON。
我把一份混着乱码、”粉白色老翁”、平淡商品和空值的测试文档,隔离丢给Claude和DeepSeek。
两个模子皆乖乖把平淡商品送进了success通说念,把”粉白色老翁”和其他仙葩输入送进了error通说念。总共这个词输出仍然是一份100%结构化的JSON数组,系统剖判零报错。运营在后台一键筛选status==“success”径直批量上架,一键筛选status==“error”把总共脏数据揪出来东说念主工修正。
那一刻我才意志到——大模子在这里,顺遂干完毕一个数据清洗工的活。
这就不仅仅”保证系统不崩溃”的严防性价值了。我把”AI案牍生成”和”自动化数据清洗”这两个蓝本落寞的研发程序合到了一齐。往时你需要一个NLP模子作念数据清洗,再用一个大模子作念案牍生成,两套系统、两个团队、两份成本。咫尺一套Prompt谋划,让归并个大模子在生成内容的同期,顺带把数据质检作念了。
四、这套想路在AI工程里有个词,叫harness
写到这里我得诚挚交接一件事。我作念完这套谋划、有点小陶然的时刻,跟一个作念AI的一又友聊了聊。他听完笑了一下说:”你这套东西叫harness。”
我查了一下,这个词指的便是给模子套一层外部框架——输入校验、输出schema、fallback通说念、guardrail。社区里早就有共鸣了。我以为我方发现新大陆,其实仅仅撞上了一个已有的东西。
但此次”撞车”反而让我想了了了一件事:AI居品司理的中枢责任,可能不是环球以为的那样。
招聘市集上的AI居品司理JD写得很侵犯——”懂大模子道理””练习LangChain””有Agent落地劝诫”。但我我方作念下来,这些其实皆是次要的。
真确决定AI居品成败的,其实是两件挺朴素的事。
一个是知说念界限。不是看官方文档说的准确率95%,是亲私用脏数据、角落案例、对抗性输入去测它的下限。而且要测不同的模子——Claude、DeepSeek、GPT,本性各不疏通。知说念了界限,你智力谋划界限。
另一个是接收这个东西本来就不靠谱,况且围绕”不靠谱”谋划出一套生意进程。传统居品想维追求”零故障”,AI居品必须接收”故障是常态”。你要作念的是谋划故障的抒发花样——当AI无法生成时,它是该千里默、报错、照旧fallback到东说念主工?当遇到脏数据时,它是该崩溃、说东说念主话、脑补、照旧复返结构化的error码?这些选择决定了居品是”可用”照旧”不可用”。
技艺细节会过期,这两个判断不会。
我作念居品这些年,学过SQL、学过增长、学过用研。学AI是头一次让我感受到——你越想“系统性地学懂它”,你越学不会。AI更像一个有点暴本性的同事,光看简历(技艺文档)没用。得真和它同事过,被它坑过几次,智力冉冉摸清它的本性。
五、这套想路不全能
得踩一脚刹车。任何新发现皆容易被我方神化。harness这套想路照实通达了一扇门,但门后不是一派莫得攻击的花坛。
不是总共脏数据AI皆能识别。我的分流机制依赖的是大模子的”学问”——它知说念”粉白色老翁”不是商品。但学问有盲区。要是脏数据伪装得好,比如把”假冒伪劣”写成”高性价比平替”,AI无意识别得出来。波及伦理、合规、安全的明锐数据(涉政、涉暴、侵权内容),更不行浅薄分流了事,必须设硬把握。
AI的“失实分类”我方也会出错。大模子可能把一条平淡但表述奇特的商品误判为脏数据,也可能把真确的脏数据放进success通说念。这个二阶失实概率虽低,在大界限数据场景下会被放大。error通说念里的数据仍然要东说念主工抽检,不行实足信任AI的”自我审查”。
这套步调有明确的适用界限。它主要适用于内容生成、数据预处理、信息结构化这些数字业务场景。对于需要强收罗效应、重线下运营、高成本干与的领域——半导体、医疗器械、连锁零卖——AI能提供的杠杆有限,”一东说念主公司+AI”那套叙事并不适用。
终局
回头看阿谁无理的”粉白色老翁”,我想说的其实很浅薄。
学AI这件事,我走过的弯路是想先把”基础”打牢。自后发现,真确帮我初学的,是一个具体到不行再具体的Prompt任务,加上一次有益为之的压力测试。
要是你也想学AI居品,我的忽视是:别贪多,带着一个真是问题去和它打交说念。被它坑过几次,你比读十本书学得快。
至少对我来说是这样开云app。

备案号: