选品是跨境电商最核心也最玄学的环节。卖什么决定了八成的生死,但它高度依赖经验、直觉和一点运气。所以当 AI agent 火起来,几乎每个跨境卖家都在问同一个问题:能不能让 agent 帮我选品。我们答应过三家客户的这个需求,三次都没做成。这篇文章不写成功,只写这三次失败——因为它们各自暴露了一个不同的、值得记下来的问题。

先说一个总结性的判断。这三次失败,没有一次是模型能力不够。模型很聪明,给它干净的数据、清晰的目标、明确的约束,它选出来的品像模像样。真正的失败发生在更上游——在我们怎么定义「选品」这件事本身。下面三个案例,对应三种典型的定义错误。

§ 01案例一:数据源失真,选出来的是幻觉

第一家客户做家居用品,铺货欧美市场。他们的诉求是让 agent 每天扫一遍各平台的热销榜、社媒趋势、关键词热度,自动产出一个「值得上架的新品清单」。我们做了。agent 跑起来,每天交清单,清单看起来很专业——有趋势分数、有竞争度评估、有预估利润空间。

问题在第三周暴露。客户照着清单上了二十个 SKU,其中十一个完全没动静。我们回头查,发现 agent 抓取的「热销趋势」数据源里,混进了大量被刷出来的虚假热度——某些第三方趋势站的数据本身就掺水,agent 没有能力分辨「真实需求上涨」和「被营销刷出来的短期热度」。它忠实地把垃圾数据加工成了一份精美的报告

「agent 不会质疑数据源。你喂它假象,它就还你一份结构精美的假象。」

— 失败复盘 · 案例一

这次失败教给我们的是:选品 agent 的瓶颈从来不是分析能力,是数据源的可信度。后来我们意识到,与其让 agent 去抓那些来路不明的趋势站,不如让它只用客户自己店铺的真实成交数据、真实退货数据、真实评价数据——数据量小,但每一条都是真的。基于真实数据做趋势外推,远比基于大量假数据做精密分析靠谱。但这家客户当时没有耐心做这个调整,项目就停在了这里。

§ 02案例二:评估指标错位,选对了却卖不动

第二家客户做 3C 配件。他们吸取了前车之鉴,数据源用的是自己平台的真实数据,很干净。这次 agent 选出来的品,趋势判断也对——选中的几个品类,后来市场确实涨了。但客户上架后还是亏了。

问题出在评估指标。我们当初和客户一起定的优化目标是「预估市场需求增长率」,agent 兢兢业业地朝这个目标优化,选出来的都是「需求在涨」的品。但「需求在涨」不等于「你能赚钱」。这些品需求在涨,是因为大卖家也都看到了,它们同时也是竞争最惨烈、价格战最狠、广告成本最高的品。客户一个中小卖家挤进去,需求是真的,利润是负的。

优化目标
案例二 · 初版
修正后建议
核心指标
需求增长率
单位利润 × 可获得份额
是否计入竞争烈度
是 · 权重最高
是否计入广告成本
选出品类的实际结果
需求对 · 利润负
需求中等 · 利润为正

Tab. 01 — 选品 agent 优化目标错位与修正 · 数据脱敏

这次失败的教训是:agent 会忠实地优化你给它的指标,所以指标定错,努力越多错得越远。一个中小卖家真正该优化的不是「需求增长率」,而是「我能拿到的那部分份额能不能赚钱」——一个把竞争烈度、广告成本、自身供应链优势都算进去的复合指标。这个指标很难定义,需要客户深度参与。而这家客户更希望我们「给一个能直接用的 agent」,不愿意花时间一起打磨指标。指标没打磨好,agent 再勤奋也是错的方向。

§ 03案例三:人不在回路,agent 越权做了决策

第三家客户做服饰,是三家里技术理解最深的。数据源干净、评估指标也和我们反复打磨过。这次 agent 的选品质量明显高于前两次。但项目还是失败了,失败的原因和前两次完全不同——这次是流程设计的问题。

客户为了追求效率,要求我们把 agent 做成「全自动」:agent 选品、生成 listing、定价、甚至直接调用平台 API 上架,全程不需要人工确认。我们当时提了异议,但客户坚持,说人工确认是瓶颈,要的就是自动化。我们让了步。

结果是,agent 在一次趋势误判后,连续上架了一批不适合该客户品牌调性的低价快消款——选品逻辑上没错,那些款确实有需求,但它们和客户精心经营了三年的中高端品牌形象严重冲突。等运营人员发现时,这批 SKU 已经在店铺里挂了五天,影响了店铺的整体调性标签。agent 没有犯技术错误,它只是做了一个不该由它做的决策

· · ·

这次失败让我们彻底定下一条规矩:选品 agent 可以做到「选」,但「定」必须留给人。agent 输出候选清单、给出每个候选的依据和风险提示,运营人员花十分钟扫一遍、勾选放行——这十分钟不是瓶颈,是一道必要的闸门。它拦住的不是 agent 的高频小错,而是那种低频但致命的方向性错误。把人从回路里拿掉,省下的是十分钟,赌上的是品牌。

§ 04三次失败的共同点

把这三个案例放在一起看,会发现它们指向同一个东西。案例一是数据源的问题,案例二是评估指标的问题,案例三是流程闭环的问题——表面上三个不同的坑,本质上是同一件事:我们和客户都太快地跳到了「让 agent 干活」,而跳过了「把问题定义清楚」

选品这件事,难的从来不是分析,是回答三个前置问题:什么数据是可信的、什么指标是真正该优化的、哪个决策点必须由人把关。这三个问题答清楚了,agent 才有用武之地;答不清楚,agent 越强,错得越快越漂亮。

所以现在客户再来谈选品 agent,我们第一件事不是聊模型、不是聊技术方案,而是反过来问他:你现在选品,最常踩的坑是数据不准、还是判断标准模糊、还是该谁拍板没说清。先把失败的根源找出来,再决定 agent 该补哪一环。这三个失败案例最大的价值,就是让我们学会了在动手之前先停下来问这几个问题。