快捷搜索:

深度|解读天猫的智能搜索&智能推荐

 

搜索和推荐,是电商平台里用户和商品信息交互的两种主要方式,也是电商平台内的两大自然流量入口。前者为用户主动触发,系统提供智能召回和排序;后者为用户在特定场景下,被动接收千人千面的个性化推荐的商品。

天猫作为国内顶级的B2C电商平台,产品打磨时间之久、用户量级之大有目共睹。本文上篇依个人愚见,从场景解读天猫的智能搜索和个性化推荐,下篇简要介绍搜索和推荐的中后台支撑。

PS:产品体验基于ios版天猫客户端 V7.12.10

上篇:场景解读

(一)智能搜索

找商品是用户的基本诉求,搜索栏便是满足搜索诉求的载体:在搜索栏内输入关键字点击搜索、搜索列表页找到合适商品,点击进入详情页购买,这是一个简单直接的转化路径。

有几个业务问题需要考虑:

如何理解及预测用户找什么?

如何根据搜索关键词匹配正确商品?

庞大的搜索结果列表如何排序展示?

天猫的智能搜索解决方案如下:

1. 搜索详情页

搜索栏内关键词智能预测。比如搜索关键词“彼得兔”,结果列表页未发生点击,每次返回首页时,搜索栏内均提供了预测关键词,依次是:彼得兔公仔、动物毛绒玩具、毛绒玩具小、兔子毛绒玩具、毛绒玩具、生日礼物女生等关键词。天猫在通过不断的修正关键词,预测、挖掘用户意图。

最近搜索,可记录最近几条搜索关键词,点击可直接再次发起搜索行为,提高输入效率。

搜索栏下还提供了猜你想找,提供了5条推荐关键词,其中有搜索关键字相关的个性化推荐,也有不相关的挖潜关键词,是搜索和推荐结合的产物。

图片搜索,AR buy+、拍照识别,基于图像识别技术,识别图片场景中的主体,并搜索库中的商品。图片搜索非常适合于不能用语言准确描述主体,又能快速搜索到相关商品的场景。

语音搜索,基于语音识别技术,将输入语音转化成文本,搜索相关商品。方便快捷的特性,使语音搜索已经成为搜索引擎的标配。

2. 搜索结果列表页

传统的搜索引擎是根据输入关键词,返回固定检索结果,而天猫会根据用户行为和画像,并结合卖家的流量投放诉求,实时调整搜索结果,以保证搜索结果的召回率、准确率,及个性化的排序。

召回率(Recall Rate)=检索到的相关商品 / 所有相关的商品总数,也叫查全率。召回率不足会导致明明有此商品却没有搜出来。

准确率(Precision Rate)=检索到的相关商品 / 所有检索到的商品总数。

排序会根据用户的历史行为、品牌偏好、价格偏好、商品销量、商品评论等,将最优结果排在前面,达到个性化的排序,以提高用户和商品的匹配效率。

(二)智能推荐

同搜索一样,推荐也是天猫重要的自然流量入口。推荐解决了用户在逛、找、比、等、凑、买等全链路购物场景下,用户与商品高效的个性化匹配。

天猫的智能化推荐解决方案如下:

1. 首页

首页是天猫的第一流量入口,承载着用户流量分发、用户兴趣探索等作用。

轮播图。位于首页最显眼的位置,9张banner图自动切换,位置的优越性足以体现其带来的流量转化价值。首页轮播图栏位一般是强人工运营的活动栏位,轮播图内容是针对所有用户的白名单。但是由于天猫用户的广泛性,消费能力各异、兴趣各异,因此活动的定向投放可以防止流量资源浪费,提高运营效率。定向投放的规则基于用户历史行为、兴趣偏好、消费能力、促销敏感度等用户行为和用户画像,如男性用户看到的秋冬服装活动推广是“男士羽绒服”;浏览过某款橄榄油的用户看到“天猫食品频道买一送一”活动。海报上的橄榄油图片设计可能出自设计师,也可能出自AI设计平台“鹿班”。总之,强人工运营规则加部分个性化介入的banner,使用户体验和流量价值最大化。

限时抢购提供性价比很高的商品,抢购活动倒计时暗示用户不要错过。提供的商品列表里有基于用户长期和近期兴趣的商品,也提供了热门爆款商品,主打性价比,“消费降级”模式。

天猫好物同样是基于用户历史行为,个性化推荐的商品列表。与其他栏位不同的是,此栏位的商品海报很大很精致,每页仅展示一个商品。图片同价格。推荐业界公认的法则:推荐场景>UI>算法。鹿班千万级的白底图库提供的白底和素雅海报搭配显得很精致,让人联想起无印良品和网易的“严选”模式。

聚划算提供高性价比商品,但已经是阿里旗下另一大平台,有单独app。此处为聚划算引流,不再展开解读。

发现品牌是天猫第五层栏位。不同于其他栏位的商品纬度,发现品牌是以品牌纬度为切入点,完成品牌新品、资讯的推荐分发。

发现品牌顶层和底层分别是3个每日更新的限量潮流尖货品牌和4个随下拉刷新的个性化关注品牌,均是基于用户历史行为计算出的品牌偏好。点开分别展示单品页和品牌详情页,前者的单品页以品牌某款新品为主,提供该单品的大幅海报及品牌其他新品推荐;后者品牌详情页提供了品牌简介、新品上市、限时特价、品牌资讯等内容,还提供了相似品牌推荐,如根据苏泊尔品牌推荐九阳、美的等品牌。

中层左侧是天猫小黑盒。天猫小黑盒定位于提供全球新品营销一站式解决方案。天猫官方会从世界各地搜索最近30天新鲜上市的全球新品提供给用户。天猫小黑盒结合热卖、热搜、好评等多重标准,提供基于个人兴趣的新品榜单,品类划分很细。结合下方的“新品精选”、“最新上架”、“人气新品”,可最大程度解决基于商品的协同过滤算法遇到的商品冷启动问题,为新上市商品提供流量曝光和打造爆品的机会。

中层右侧是品牌头条,实为粉丝福利社,首页主搜下同样有入口,提供品牌权益相关。

为什么品牌这个维度也会如此重要?原因可能有很多。对用户来讲,用户喜欢高质量的商品,而品牌是高质量的保证,因此在点击、购买商品时会越来越重视品牌的选择,有强烈的品牌认同感;另外,用户还可能是某品牌代言人的忠实粉丝而对该品牌有特殊偏好。

推荐榜单。推荐榜单提供了5个人气榜单和5个趋势榜单,均是细分品类,跟用户的兴趣强相关。榜单每日更新,根据销量、搜索量、好评等通过热榜算法计算得出,排序是非个性化的。推荐榜单给用户推荐关注细分类目下的热门商品,进一步丰富购物场景,促进用户点击并达成交易。此外,还可在一定程度解决用户冷启动的问题。榜单是基于用户兴趣的,而不是统一的榜单,是因为:天猫品类繁多,不像图书类电商或音乐应用可以提供标准化的热销榜或Top10;天猫的用户体量已经足够大,现阶段可淡化用户冷启动问题,直接提供基于用户行为的细分类目榜单也未尝不可。

猜你喜欢。作为最经典的推荐场景,猜你喜欢栏位位于首页末尾,第三屏即可划到,以瀑布流的方式展示近200条个性化推荐的商品。之前的版本,200条推荐结果是分类目展示,比如服装、电器、食品等,而且类目tab顺序还会个性化调整。最近版本去掉类目tab,直接切换为瀑布流的方式。个人感觉不如之前的好。

对用户,猜你喜欢的推荐场景可最大限度的满足用户无限刷屏、闲逛的场景。对平台,可以提供用户个性化体验,探索用户购物兴趣,刺激用户消费,促进交叉销售。

一般地,猜你喜欢栏位应用基于物品的协同过滤算法,输入用户搜索、浏览、加购等行为的商品,也可能会加上用户的年龄、消费能力、价格敏感度等标签元素,输出的直接是推荐结果,很难提供推荐理由。但前两条推荐结果有推荐理由。进入商品详情页不难发现,推荐理由其实是来自于商品评论中最高频的两个关键词。

此外,每条推荐结果都提供了“看相似”功能,可以针对当前推荐结果进行下钻,查看相似商品、相似品牌、相似榜单、相似搭配,进一步挖掘用户意图,引导用户达成交易。

推荐结果的点击行为可作为正反馈,曝光未点击、长按删除行为可作为负反馈,以此为依据持续对推荐模型进行调优,使推荐结果更加精准。

首页下拉刷新后会切换排序方式,可能是基于两种不同的排序算法,如点击率预估CTR/转化率预估CVR。

2. 商品详情页

商品详情页是用户完成加购、提交订单行为的重要页面。用户看完商品的图文详情,如果不感兴趣就会跳出该页面。因此,图文详情的最下方,适时地提供了“看了又看”和“精选好货”推荐栏位。

看了又看栏位的输入是当前浏览的商品ID,通过关联挖掘规则输出相关商品,仅展示当前品牌、当前店铺的商品,该场景的业务价值在于引导用户路径转化,防止用户流失,并提供其他相关商品,引导用户进入详情页完成交易。

精选好货栏位的输入是用户历史搜索、浏览、加购等行为的商品ID列表,通过关联挖掘规则提供的推荐商品列表。该栏位适用于闲逛过程中中断当前商品的购物链路,转向其他感兴趣的商品的场景。但探索用户的兴趣路径略深,个人感觉,如果改为推荐其他品牌或其他店铺的相关商品会更闭环、更合理一些。

对于天猫超市的商品详情页,推荐场景则有所不同。商品详情页的首页下方直接展示推荐栏位,分别是猜你喜欢、看了又看、买了又买。考虑到天猫超市大部分都是快消品,精选SKU,用户的选择成本已经变得很低,比货、选货环节变弱,交易效率更高,因此推荐栏位从图文详情后面的较深位置直接提前到了首个tab第二屏位置。

看了又看栏位根据浏览当前商品的人协同过滤计算出还看了哪些商品,品类与当前商品一致,提供的是相似商品列表,扩大用户的挑选范围。买了又买栏位运用购物篮关联挖掘,根据购买当前商品的人计算出还买了哪些商品,提供的是互补商品列表,深度挖掘用户购物意图,以达到交叉销售的目的。典型场景如某款婴幼儿奶粉,看了又看推荐的是其他品牌的奶粉,而买了又买推荐的是母婴人群关注的日常易耗品洗衣液。看了又看和买了又买提供的是8条推荐结果,交互为左右滑动加载全部。个人感觉如果将每屏最后的结果只显示一半,暗示用户可左右滑动,交互会更合理。当然,是不是天猫的产品经理有意而为之就不好猜测了。

猜你喜欢栏位更像是两种推荐策略的结合,即相似商品、互补商品的推荐结果合集。

3. 购物车页

购物车同样是非常重要的功能页,承载着收藏、提交订单等功能。购物车页内每个加购的商品左滑有“点击发现”,与删除功能并列,设计也是别有心意,起到一定引导作用。点击发现,则根据当前加购商品ID,推荐的相似商品、相似榜单、相似品牌,类似于上述推荐结果列表的“看相似”功能,下钻推荐,进一步帮助用户找到目标商品并达成交易。

加购的天猫超市商品有“去凑单”功能,根据天猫超市内加购的商品ID,获取关联推荐的商品列表,以价格纬度展示,完成用户的“满88元包邮”的个性化凑单场景。

加购的失效商品,推荐相似的商品列表,推荐策略类似于商品详情页的猜你喜欢。

最下方是猜你喜欢栏位,根据加购的所有商品列表,推荐相关商品,可以帮助用户完成货比三家的场景。

4. 支付完成页

商品支付完成,意味着完整的购物链路已经完成。支付完成后,下方依然有推荐商品栏位,没有名字,暂且叫猜你还想买栏位,推荐场景是根据用户购买及浏览足迹,继续推荐相关商品,引导用户点击并完成下一个购物链路,良性循环。

总结

总体来说,天猫的推荐场景覆盖了首页、商品详情页、购物车页、支付成功页等主要购物链路的每个环节。围绕电商领域几个核心KPI:CTR点击率、CVR转化率、GMV商品交易总额,天猫推荐系统通过复杂、适时的推荐算法和推荐策略,架起了海量用户和海量商品的桥梁,为用户千人千面的推荐个性化商品,其核心目标无外乎是:引导用户点击、引导用户转化、增加用户粘性。相信随着推荐场景及算法的不断迭代,推荐系统会为天猫提供更高的销售转化。

下篇:中后台支撑

早在2015年,阿里就提出了“大中台、小前台”的发展战略。其中中台将集合整个集团的数字运营能力、产品技术能力,对业务前台形成强力支撑。本文的下篇就简要介绍几个搜索和推荐相关的中后台。

HA3搜索召回引擎

检索系统的流程如下:用户→匹配&推荐→预估模型→排序展示。匹配(match)和排序(rank)是两个重要环节,召回结果的质量主要决定了搜索结果的质量。HA3是阿里巴巴搜索团队开发的搜索召回引擎平台,经过多年迭代,已经形成一套高效的在线数据存储和管理框架,离线产出索引,在线响应用query。

在线机器学习系统

面对10亿级的商品,全库检索是不可能的,将10亿商品转化为30层的二叉树,机器学习层每层扫描,寻找最优,从而将10亿次衡量转换为30次从上到下的衡量。后面的预估模型对给定的商品做兴趣度的预估,点击率预估、转化率预估,通过预估后面有一些排序展示。

阿里搜索技术体系目前有offline、nearline、online三层体系,既能保证日常流量下稳定有效的搜索,也能满足双11场景下的短时高并发。通过批量日志下的offline离线建模,到nearline下针对增量数据的实时建模在线预测,然后到在线机器学习和决策。

传统的LTR(learning to rank)是根据历史的数据构造样本,回归出排序权重。这种方法解释了过去的现象,但未必是全局最优的。经常给用户反复展示历史行为的检索结果,缺少有效的探索能力。而通过在线强化学习(Reinforcement Learning,RL),可对商品排序进行实时调控优化。

强化学习的过程很像是条件反射。如果把搜索引擎看成智能体(Agent),用户看成环境(Environment)。Agent每一次排序策略的选择可以看成一次试错(Trial-and-Error),把用户的反馈,点击成交等作为从环境获得的奖赏。在这种反复不断地试错过程中,Agent将逐步学习到最大化累计奖赏,从而得到最优的排序策略。

品牌个性化排序系统

前面文章提到过品牌的重要性,除了在首页的“发现品牌”栏位,搜索结果排序中,品牌因素也至关重要,将不同品牌的商品混杂在一起无疑增加了选择成本。跟品牌强相关的特征即价格,因此将商品价格划分为7个区间,并结合8个电商指标:CTR点击率、CVR转化率、GMV商品成交总额、ATIP客单价、搜索次数、点击次数、加购次数、交易次数,形成56维向量。用户行为类型特征也跟品牌强相关,购买的权重会大于浏览和加购的权重。然后基于此训练一个分类器。针对给定的用户id,使用分类器预测喜欢不同品牌的概率,基于概率对品牌排序。最终的搜索结果排序中,融入品牌的特征,满足了有品牌偏好用户的需求。

电商知识图谱

阿里拥有全国最大的电商领域关系图谱,约几十亿实体、千亿边和几十种关系类型。其中包括:

  • 用户社交圈:新浪微博关注、支付、淘宝天猫关注、通讯录、家人、好友等;
  • 用户生活圈:家庭住址、工作地点、小区、城市、学校、商圈等;
  • 用户行为:商品的浏览、加购、收藏、购买、评价等;
  • 用户标签:偏好类目、偏好品牌、偏好店铺等;
  • 商品关系:商品相似、同款、搭配、一起买、凑单等。

知识图谱将数据和知识高度结构化,可应用在搜索次归一、搜索推理联想、智能问答、智能审核商品发布等领域。

ABFS统一特征服务平台

ABFS(AliBasic Feature Sever),统一特征服务平台,主要负责用户实时数据的处理及特征统计,如用户的基础行为特征(浏览、加购、收藏、购买)、统计特征(点击次数、转化率)。用户的实时数据在ABFS上,传递到TPP平台供BE调用。

TPP推荐平台

TPP(ThePersonalization Platform)平台,也称阿里推荐平台,承接了阿里集团300+重要的个性化推荐场景,包括首页猜你喜欢、购物链路等。TPP平台集成了RTP、iGragh、BE等常用服务,方便数据的流动调用,降低开发成本,帮助业务和算法快速上线迭代。

BE向量化召回引擎

BE(BasicEngine),向量化召回引擎,是DII中的推荐召回引擎,负责从多种类型的索引表中召回商品,并对候选商品集合进行过滤和粗排序。线上召回效率极高,可以在几毫秒内对全库商品进行召回。

RTP实时打分预测引擎

RTP(RealTime Prediction),实时打分预测引擎,收到TPP推荐系统的前端请求后,RTP平台实时产出特征,运行CTR、CVR等各种预估模型,并对请求列表中的每个商品计算分值,得出精排序结果列表。

iGragh图查询引擎

超大规模分布式在线图存储和检索。数据流程中的用户特征、用户偏好类目、热门商品召回等信息,不需要频繁更新,存到iGragh上方便存储和调用。

Porsche在线学习平台

Porsche是基于Blink的分布式流式计算框架,提供了日志处理、特征计算和实时建模的插件接口。算法人员通过在Porsche平台上离线调试模型,调到最优结果再发布到线上。如:用户商品复购率模型、用户商品喜好归因分析模型等。

鹿班智能设计平台

鹿班(AI Graphics) 智能设计平台,包括智能生成、创作助手、智能排版、设计拓展等功能模块,可帮助企业快速、批量、自动化的进行图片设计。

  • 一键生成:将商品相关素材、文字输入,选择自己需要的海报尺寸、风格等,可自动生成符合要求的海报作品。
  • 智能排版:将拍摄好的照片和需要的文字输入,选择尺寸,可自动生成带有随机风格的海报作品或产品展示。
  • 设计拓展:将设计完成稿输入,选择需要拓展的尺寸,可自动生成相应拓展尺寸的结果。
  • 智能创作:拥有自己独特风格的设计师将自己创作好的系列作品输入,可以训练机器,并成为系统新的效果风格。

2017年双11,鲁班总共设计了4亿张海报,平均每秒设计8000张,每天完成4000万张海报制作。截至目前,鲁班已经累计设计了10亿次海报,极大节省了海报设计成本。

题图:来自2018UCAN用户体验设计论坛

文章来自社区签约作者: Herman Lee

— END —

[注:本文部分图片来自互联网!未经授权,不得转载!每天跟着我们读更多的书]


互推传媒文章转载自第三方或本站原创生产,如需转载,请联系版权方授权,如有内容如侵犯了你的权益,请联系我们进行删除!

如若转载,请注明出处:http://www.hfwlcm.com/info/290949.html