加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 黄冈站长网 (http://www.0713zz.com/)- 数据应用、建站、人体识别、智能机器人、语音技术!
当前位置: 首页 > 运营中心 > 产品 > 正文

从算法原理,看推荐策略

发布时间:2017-06-30 08:43:04 所属栏目:产品 来源:woshipm.com
导读:副标题#e# 在信息量爆炸的今天,由于范式的转移,传统的内容和渠道已经不再是稀缺资源;在今天,将信息和内容更好更精准得呈现在用户面前,才是全方面提高效率的方式,真正的稀缺资源变成了「推」和「拉」。而在这一切的背后,推荐算法的作用都功不可没。

基于内容的协同过滤算法,最主要的初级步骤是通过分词技术对标题和简介等进行处理,形成特征标签。例如,对于图书和电影而言,可以对名称和简介进行特征词提取,从而构建特征向量;当然,在豆瓣上发现可以用一种更省事的方法,就是让用户进行对作品评价时需要勾选相关的标签,这样只要为不同种类提供足够多的标签供用户选择即可(当然这是我猜的);

而如果对于音乐的推荐呢?没有相关简介,歌名也不具备足够的指向性,这种情况下则可以通过音乐本身的类别来作为标签进行特征向量的构建,例如:民谣、摇滚、怀旧等;我猜这也是网易云音乐采用的一种推荐方式吧。

而对于36氪之类的资讯网站,采用什么样的推荐算法也能够有一定程度的理解了吧,原理都是类似的。

基于内容的推荐由于不需要太多的惯性数据,因此可以部分解决冷启动问题和流行性偏差,也就是弥补了协同过滤算法中的部分不足,因此也可以将两者混合起来使用,例如混合推荐算法就是采用了这样的方式;其次,需要注意的是,如果单纯使用基于内容的过滤算法,会出现过度专业化问题,导致推荐列表里面出现的大多都是同一类东西,有的小伙伴可能也观察到了类似的现象,比如在亚马逊上购买哪本书(比如java相关的),会发现推荐的书籍里全是java相关的,就是因为出现了过度专业化的现象。

结语

推荐算法的原理其实基于数学的原理得到解决(向量、余弦相似度等),其实其他各类也同理,都是可在数学的基础上得到思路和衍生,如用来进行情感判断的朴素贝叶斯算法,就是将人才能理解的情感问题转化成了基本的概率问题而得到解决,包括自然语言处理(NLP)和语音识别等,由此真是可以体会到数学的博大精深啊。

作为一名初级产品汪而言,从算法原理角度理解一些实际问题还是很有帮助的,当然具体上手层面还需要开发同学的大力协助。

关于文中对推荐算法的理解和猜测,若有不足之处欢迎指教~

文章作者系 @Mr_yang 未经许可,禁止转载。

(编辑:PHP编程网 - 黄冈站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读