换个角度看推荐

从业务视角理解算法,用好算法


人工智能——生产力工具

导言


从历史说起

  • 1946 年宾西法尼亚大学诞生了世界第一台电脑——ENIAC;
  • ENIAC 比人类算数快很多(每秒 5000 次加减法),引起世界一片惊叹和争论;
  • ENIAC 是什么,能做什么,只有科学家懂;
  • 我们不是科学家,但如今的我们可以用手机创造更大的生产力

文明史就是工具进化史

  • 第一次工业革命,掀起了“羊吃人”运动,解放了大量生产力,促使了资本主义的诞生;
  • 第二次工业革命,人类进入电气化时代;包括后来计算机的普及,人没有被淘汰,而是利用工具创造了更大的价值;
  • 人工智能,依旧不是为了替代人而产生的,而是解放人们在智力上的重复劳动。

谁最应该用好算法

  • 算法工程师类似于电脑制造商,负责造出更快的、性价比更高的电脑;他们的技能树不是“如何使用电脑”;
  • 业务同学(运营、产品)不需要理解电脑底层的电路原理、运转机制,但他们才是真正发挥电脑作用的人;
    • 亚洲四大邪术之中国 PS 术,都是电脑达人吗?

算法原理

第 1 节


如何理解“算法(人工智能)是解放人类在智力上的重复劳动的工具”?


运营是如何进行推荐的?

  • 如果有一个货架需要运营同学来搭建,普通的运营会怎么做?
    • 先解决千人一面的问题。
    • 如果场景的最终指标是 ctr,那么就把 ctr 最高的那些商品放到场景中来;
    • 商品的 ctr 跟场景是相关的,所以要数据驱动,保持场景中的商品始终是当前 ctr 最高的那些商品。

进阶一下:分人群运营

  • 如果我们对人群做把控,男性和女性可以看到不同的货架,那么如下做就可以提升整体效果:
    • 男性看到对男性而言 ctr 最高的商品;
    • 女性看到对女性而言 ctr 最高的商品;

再进阶一下:精细化运营

  • 如果能将用户区分得更加精细(例如:中国东北 30~35 岁高购买力男性),类似这样的简单组合,就可以将人分为大概 700 多类。
  • 推荐算法就是用类似的方法,可以自动的对上述分类进行数据驱动下的自动商品货架调整。
  • 推荐中最有效的策略(i2i)是这种分类:刚刚看过某个商品的人群,对他们而言哪些商品的 ctr 更高。

算法的本质

第 2 节


推荐(搜索)算法的本质是学习用户的行为


万物皆可“个性化”吗?

  • 推荐系统能对彩票进行推荐吗?
    • 推荐算法学得是用户行为,而不是彩票;
    • 用户做不到的事情,算法就学不到;
  • 思考:算法能学出商品的质量吗?

“学习用户行为”会发生什么?

  • 为了预测用户的行为,则必须要从用户的行为中学习;
  • 但如果一个场景下,用户也无法识别商品的好坏,那算法还有效吗?
    • 电商购物场景下,用户能有效识别商品的好坏吗?他们怎么识别的?
    • 算法同学说:“我的模型中考虑了客诉、物流、用户评论、DSR 等因素”,这些因素真的起作用了吗?

帮助用户做出有效的行为

  • 推荐算法有效,背后的假设:用户行为值得学习
  • 产品设计上应当帮助用户做出有效的行为
    • 例如,辅助用户决策,将用户评论、好评率、DSR 等信息外显出来;
    • 增加点赞等丰富的用户后验的社交行为,帮助其他用户进行决策。

用户行为都值得学习吗?

  • 人都会有犯错的时候。犯错的行为不值得学习;
  • 一些高门槛的领域里,大多数用户都不是资深用户,他们的行为就未必值得学习;
  • 推荐系统要是学习了这种行为会怎样?
    • 推荐结果中充斥着大量标题党、牛皮癣、黄图、爆款等等;
    • 用户无从选择时,只能利用上述信息进行决策;反过来,也使此类内容更容易获得高点击;
    • 正确的做法:通过背书(例如品牌旗舰店),教会用户该看什么;

指标问题

第 3 节


如何评估推荐的效果

  • 推荐算法是学习过程,所以评估可以类比于考试:
    • 学得好,成绩会提升;
    • “应试教育”是存在的;
    • 不忘初心,不“唯指标”论。观察到指标的提升,还要想一想是不是效果真的提升了。

评估结果不是一切

  • 考试是衡量学习的手段,不要为了考试而学习;不要为了指标而制定策略。
  • 面对指标时,不要盲目认定“这是个黑盒”便放弃了思考;成绩不好反映的是学习过程出现了问题。
  • 成绩没反映出来问题也不代表没有问题

统计数据会说谎


如何让一个班级的成绩快速提升?

开除这个班级平均分以下的学生

  • 思考:
    • 算法可以引领消费升级吗?
    • 算法可以引领内容化吗?

关于指标的误区

  • 当我们考核点击率、客单价时,统计指标是否反应了我们的本意:
    • 我们希望同一拨人的指标均值得到提升;
    • 更准确的,我们期待人的成长,而不是数据的增长。不加限制(例如有些人流失了)的点击率提升证明不了任何事情。
    • 也回顾前面的话题:任何人群的指标增长都能证明业务的提升吗?例如作弊人群?新用户(无产品心智)人群?

算法被应用时也需要小心

推荐算法不以改变用户为目标

  • 我们希望学生学会更多知识,进而提升了成绩:
    • 教育工作者的重点会考察学生还有哪些知识没掌握,然后教会学生;
    • 算法会找出最容易考高分的卷子来提升成绩;
    • 短期内,算法指导得成绩一定更好,甚至任何时候互换老师(AB 测试),算法的成绩都更高;
    • 但算法无法指导学生变得更好。

总结


本文要点

  • 算法是工具,需要人来使用好这个工具;
  • 算法的基本原理:统计当前场景下,对于不同细分人群,怎样的推荐结果指标更好;
  • 算法的本质:学习用户行为!用户不懂的,算法也学不会。
  • 指标问题:算法是唯指标论的,但人不是。需要人把控算法,而不是算法控制人。

算法在场景中应用的要点

  • 场景要解决用户什么问题?这个问题是否可以通过学习用户行为而习得?值得学习哪些用户行为?
  • 这件事用什么指标评估?需要哪些限定条件?除了指标,还有没有其他的佐证方式?
  • 项目的不同阶段需要不同的指标和做法,不盲目使用算法,同算法工程师沟通清楚需求。

最后的一个小问题

如果产品经理的 KPI 和 算法工程师的 KPI 是一样的,那产品和算法究竟应该听谁的?