上一篇博文记录的是8月18日百度技术沙龙的听后感。可惜当时没有及时记录心得体会,时过境迁之后忘记了好多自己当时的感悟,甚为遗憾。所以今天赶紧把8月25日所听的淘宝技术沙龙内容和感受记录下来,同时也与百度技术沙龙进行一点对比。
先从一些琐碎的小点上对比一下百度技术沙龙与淘宝技术沙龙的不同。这倒不是说哪个好哪个不好,只是各有特色而已,而且没准也是不同公司企业文化与风格的一个侧面的反映。
八卦一下下,淘宝技术沙龙提供的铅笔笔头很粗,貌似没有削过。因为百度技术沙龙就在淘宝技术沙龙前一周,而且在同一所酒店的同一个会议室举办,难道淘宝技术沙龙提供的笔是之前百度技术沙龙剩下的?嘻嘻,开个玩笑。
两个技术沙龙我都认真听了,从内容上讲,感觉都很不错。印象最深刻的是,百度技术沙龙的PPT做得比较专业,讲的过程中也比较擅于引起全场的共鸣,而淘宝技术沙龙的讲师虽然讲座过程中演讲技巧不是很多,但是内容很实在,而且在回答问题环节回答得很棒。尤其值得一提的是,淘宝技术沙龙中有几个观众提的问题特别精彩,由此引发了全场活跃的气氛。
淘宝技术沙龙这次的主题是“互联网信息推荐及导购技术实践和分享”,分享嘉宾是天猫架构师温新赐、Guang.com核心架构师刘超和豆瓣网首席科学家王守崑。
天猫推荐实践经验分享(温新赐)
讲座主要涉及淘宝天猫的线上导购。温新赐将推荐分为四个方面:无用户行为时,有用户行为时,无商品时推荐,第四个方面我忘了(囧……)。
讲座中我特别注意到的一点是提到了“消费者行为经济理论”。我的感觉是,现有的很多技术不仅是算法的问题,更重要的是要结合经济学与心理学的一些原理,才能深度把握用户究竟希望接收到什么样的推荐信息。
讲座中归纳了推荐算法的六步,前三步我又忘了(再次囧……),大致是基于一些用户需求和消费者行为经济理论设计合理的推荐算法。后面三步是算法还原、需求诊断和优化方针。
针对天猫的业务本身,提出了三种思路,分别是:
所以最终采用“主算法+补足算法”的方式完成推荐算法的设计。
另外,特别提到的一点就是观察发现,有时用户会把购物车当成收藏夹来用,这样仅从购物车角度来判断用户是否真的购买该商品从而加入推荐算法中是不合适的。所以引入购物车使用度(纠结度)。并且,为了提高算法准确度,往往基于不同用户特点,采用不同算法。
最后,给出了一条建议:只有数据足够丰富时才适用推荐系统,否则效果不如规则。
下面是听众提的部分问题:
1. 我买了空气加湿器,结果电商网站还推荐空气加湿器如给我,这如何解决?
回答:建立商品数据内在关联,比如买了空气加湿器,下一步给推荐空气加湿器的滤网或者清洁设备。
2. 天猫的推荐系统采用什么语言?
回答:使用hadoop,map reduce,hive。推荐系统采用离线算法,但会结合在线用户行为进行优化。
3. 技术驱动和产品驱动如何协调工作?
回答:天猫有两个团队分别做技术角度和产品角度的推荐。
电商导购推荐技术的一些探索(刘超)
这个讲座所讲内容非常细致,但是感觉讲座的人非常不自信啊,说话声音小得多,而且刚一上来就自称是屌丝,说自己不如第一位高富帅的讲座。其实平心而论他讲的很详尽,而且作为一个创业团队,他在开发过程中遇到了更多的问题,由此而得的经验对其他人将有很大启发和帮助。当然,也同样因为创业初期,其中很多问题采用了一些相对简单粗暴的方式解决了技术难题,可能不如淘宝解决问题时技术底蕴比较浓厚和优雅。
下面是用户提的部分问题:
1. 有没有考虑过分层次、按不同优先级推荐呢?
回答:所在的“逛”网站主要面向人群为青年女性,一般女性购物时,往往比较感性,所以没有提供这么理性的推荐。因此可能未来的推荐需要区分性别。
2. “逛”网站有个“好友逛”功能,会把自己购买的东西推荐给好友。但如果我买的东西不想告诉好友呢?有没有考虑到推荐时的隐私问题?
回答:暂时没有,今后将考虑。
3. 对于点评、打分这种机制,用户会执行吗?
有听众替回答:针对某些销售化妆品的淘宝店铺进行过调查统计,发现填写反馈的以已婚女性为主。
大数据时代的个性化推荐系统(王守崑)
讲座中提到20年前amazon就开始做推荐了(难怪那么多人喜欢在amazon上买书,大概就是因为他们推荐系统做的好吧,他们实在是太有先见之明了)。推荐在电子商务中表现突出,因为它的实质是兴趣网络,相对处理起来比较容易。但是在人际网络中推荐表现得不是很好。
豆瓣上线没多久就开始推荐,是以2000年amazon的论文为基础,从协同推荐系统开始。最早的推荐应该就是“豆瓣猜你也喜欢”。
就像第一位讲师温新赐给出的不要滥用推荐系统的建议一样,王守崑同样也指出了究竟哪些产品适合做推荐:
在推荐过程中有一点需要注意就是推荐具有方向性(时效性、因果关联):比如看完《线性代数》我们可以推荐《泛函分析》,但显然看完《泛函分析》之后就没有必要推荐《线性代数》了。但是从关联度上我们会发现这两者的关联度很高。因此今后需要考虑到关联关系中的方向性问题。