关键词相关性判断原理
前言
近期,西柚找词上线了「以词找词」功能之后,我们发现许多用户对该功能及「多ASIN对比」功能板块中,自动判断关键词相关性的原理感到好奇。
因此,本文将讲解我们如何基于现有数据实现这一功能。
原理
西柚在自动评估关键词与一批ASIN之间的相关性时,主要考虑以下两个方面:
- 这批ASIN在某个关键词下的总体自然表现(总体自然流量)
- 这批ASIN中获得自然流量的ASIN数量(越多的ASIN在这个词下获得自然流量,说明该词与这批ASIN的相关越高)
即 当这批ASIN在这个关键词下的综合自然表现越好(总体自然流量越高)时,意味着亚马逊认为这批ASIN与关键词的相关性较高,那么西柚判断的相关性数值也越高。
那为什么需要使用一批ASIN判断相关性而非单个ASIN?
- 避免单个ASIN因促销、广告、特殊事件等个体因素造成的表现偏差,更客观地评估关键词与类别的真实关联。
- 通过ASIN群整体表现,准确判断关键词与整个产品类别的相关性。
什么情况下会导致自动判断相关性的数值不准?
情况一:没有选择与核心词根高度相关的ASIN群
--那么这批ASIN在这个词下大概率不会获得亚马逊官方的自然权重
案例说明:
以该关键词「donut dog bed」为例,该关键词的用户搜索意图为一款甜甜圈状狗窝(圆形狗窝)
我们将类似以下形态的一批ASIN输入到「以词找词」板块自动判断相关性输入框之后,得到一个关键词列表:


很容易发现系统自动判断相关性的结果相关性都较低,因为我们输入进去的词根与输入系统去自动判断相关性的这批ASIN从搜索意图上来说是不匹配(输入进去的产品形态为方状狗窝)、且不相关的,那么系统标记的结果自然都不高了。
情况二:选择了高相关ASIN群,但这些ASIN的自然表现较差
--在亚马逊官方算法来说,自然表现越好,相关性越高
案例说明:
我们还是以上面这个关键词为例「donut dog bed」,我们使用另一批自然表现较差的ASIN作为自动判断相关性的依据


可以看到即使这里的ASIN群高度匹配关键词(搜索意图),但是由于输入进去的这批ASIN自然表现较差(几乎没什么自然流量),那么得到的系统自动标记结果相关性也很低。
同样的例子,我们如果选择了一批自然流量表现好的强ASIN,那么最后的结果会是较为准确的:


说明:即使在输入高度相关的强ASIN之后,还会存在另外一种相关性不准的现象。
例如:

该词ABA排名200万名+,并不能同时被所有强ASIN注意到,会导致这批ASIN虽然强,但在某些情况下覆盖不到部分关键词(一批ASIN在某个关键词下的总体表现较差导致的系统自动标记的相关性较低)

情况三:没有选择足够数量的ASIN
--官方推荐至少输入10个ASIN
结论
基于以上场景,为了提升相关性评估的精准度,在选取ASIN群时需要注意以下两点:
- 尽可能选择较多的ASIN(推荐至少10个),以保证数据的全面性和稳定性;
- 所选择的ASIN必须是与核心词根、自身产品高度相关的强竞品ASIN。