机器学习在电商领域三大应用,推荐,搜索,广告中商品排序

摘要:
很自然的,如果我们可以准确预估每个商品的GMV转化率或者点击率,就可以最大化利用流量,从而收益最大。

1、业务角度
一般是在一个召回的商品集合里,通过对商品排序,
追求GMV或者点击量最大化。
基于一个目标,如何让流量的利用效率最高。
很自然的,如果我们可以准确预估每个商品的GMV转化率或者
点击率,就可以最大化利用流量,从而收益最大。
2、技术服务于业务,模型本身的迭代需要配合业务目标才能发挥出
最大的价值,因此选择模型迭代的路线,必须全盘考虑业务。
3、在点击率预估领域,常用的是有监督的模型,其中样本,特征,模型
是绕不开的问题。
4、首先,如何构建样本,设计模型的目标函数是什么,即要优化什么。
原则上,我们希望样本构建越接近真实场景越好。比如点击率模型
常用用户行为日志作为样本,曝光过没有点击的日志是负样本,
有点击的是正样本,去构建样本集,变成一个二分类。
在另一个相似的领域-----learning to rank,样本构建方法分为3类:
pointwise,pairwise,listwise.
5、pointwise范畴,即每一条样本构建时不考虑与其他样本直接的关系。
真实的场景中,往往需要考虑其他样本的影响,比如去百度搜一个关键字,
会出来一系列的结果,用户的决策会受整个排序结果影响。
6、pairwise做了一点改进,它的样本都是pair对组成,比如电商搜索下,
商品a和商品b可以构建一个样本,如果a 比 b好,
样本pair{a,b}是正样本,否则是负样本。
当然,这会带来新问题,比如a>b,b>c,c>a这个时候怎么办?
7、而listwise就更接近真实,但复杂性也随之增加,工业界用的比较少
这里不做过多描述,理论上,样本构建方式listwise>pairwise>pointwise
但实际应用中,不一定是这个顺序。
如,你在pointwise的样本集下,模型的fit情况不是很好,比如auc不高,
这个时候上pairwise,意义不大,更应该从特征和模型入手,
一开始就选择pairwise或者Listwise,并不是一种好的实践方式
8、其次是模型和特征,不同模型对应不同的特征构建方式,比如广告
的点击率预估模型,通常就有两种组合方式,采用大规模离散特征+logistic
regression模型或种小规模特征+复杂模型。

免责声明:文章转载自《机器学习在电商领域三大应用,推荐,搜索,广告中商品排序》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇chrome内核浏览器缓存资源找回方法QT总结下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

可视化机器学习工具软件的比较分析研究

可视化机器学习工具软件的比较分析研究 Ø 摘要 近年来,随着人脸识别、语音识别等技术的突破性进展,隐藏在它们背后的底层技术也引起工程和研究人员的高度重视,譬如机器学习。然而,机器学习是一个入门门槛相对比较高的技术领域,大部分的工程技术人员和业务人员都聚焦在业务领域的特征提取,算法选择,参数调优和模型验证上,因此一个方便高效的可视化工具,对于降低用户的机器...

人工智能深度学习入门练习之(26)TensorFlow – 例子:人工神经网络(ANN)

人工神经网络(ANN)介绍 生物神经元 人脑有数十亿个神经元。神经元是人脑中相互连接的神经细胞,参与处理和传递化学信号和电信号。 以下是生物神经元的重要组成部分: 树突 – 从其他神经元接收信息的分支 细胞核 – 处理从树突接收到的信息 轴突 – 一种被神经元用来传递信息的生物电缆 突触 – 轴突和其他神经元树突之间的连接 人脑神经元处理信息的过程:...

机器学习之聚类算法

(一)K-means 提到k-means不得不说的许高建老师,他似乎比较偏爱使用这种聚类方法,在N个不同场合听到他提起过,k-means通过设置重心和移动中心两个简答的步骤,就实现了数据的聚类。下面就来介绍下k-means算法。 一、   数值属性距离度量 度量数值属性相似度最简单的方法就是计算不同数值间的“距离”,如果两个数值之间“距离”比较大,就可以认为...

三种Js深度学习框架介绍

谈到机器学习,我们脑海首先蹦出的编程语言是什么?一定是python。其实除了python,JavaScript也是不错的选择。都说现在是大前端时代,从移动开发、服务器端,甚至桌面软件开发(比如大名鼎鼎的VS Code),都有JavaScript的身影。   用Javascript写机器学习应用,当然不会从头开始手写机器学习算法和模型,通常会借助现有框架。我...

超详攻略!Databricks 数据洞察

简介: 5分钟读懂 Databricks 数据洞察 ~ 更多详细信息可登录 Databricks 数据洞察 产品链接:https://www.aliyun.com/product/bigdata/spark(当前产品提供¥599首购试用活动,欢迎试用!) 开源大数据社区 & 阿里云 EMR 系列直播 第四期 主题:Databricks 数据洞察...

动手学深度学习-导入python模块:d2l_pytorch

importsys #其中将".."里面的..换成d2lzh_pytorch文件夹的上一级路径 sys.path.append("..") from d2lzh_pytorch import * 其中错误:OSError: libtorch_cpu.so: cannot open shared object file: No such file or d...