换个角度看推荐

2017-10-11 · 5 分钟 · 癸老师

## 换个角度看推荐

> 从业务视角理解算法，用好算法

---
## 人工智能——生产力工具

>导言

---
#### 从历史说起
- 1946 年宾西法尼亚大学诞生了世界第一台电脑——ENIAC；
- ENIAC 比人类算数快很多（每秒 5000 次加减法），引起世界一片惊叹和争论；
- ENIAC 是什么，能做什么，只有科学家懂；
- 我们不是科学家，但如今的我们可以用手机创造更大的生产力

---
#### 文明史就是工具进化史
- 第一次工业革命，掀起了“羊吃人”运动，解放了大量生产力，促使了资本主义的诞生；
- 第二次工业革命，人类进入电气化时代；包括后来计算机的普及，人没有被淘汰，而是利用工具创造了更大的价值；
- **人工智能**，依旧不是为了替代人而产生的，而是解放人们在智力上的重复劳动。

---
#### 谁最应该用好*算法*？
- 算法工程师类似于电脑制造商，负责造出更快的、性价比更高的电脑；他们的技能树不是“如何使用电脑”；
- 业务同学（运营、产品）不需要理解电脑底层的电路原理、运转机制，但他们才是真正发挥电脑作用的人；
	- 亚洲四大邪术之中国 PS 术，都是电脑达人吗？
---
## 算法原理

> 第 1 节

---

> 如何理解“算法（人工智能）是解放人类在智力上的重复劳动的工具”？

---
#### 运营是如何进行推荐的？
- 如果有一个货架需要运营同学来搭建，普通的运营会怎么做？
	- 先解决千人一面的问题。
	- 如果场景的最终指标是 ctr，那么就把 ctr 最高的那些商品放到场景中来；
	- 商品的 ctr 跟场景是相关的，所以要数据驱动，保持场景中的商品始终是当前 ctr 最高的那些商品。
---
#### 进阶一下：分人群运营
- 如果我们对人群做把控，男性和女性可以看到不同的货架，那么如下做就可以提升整体效果：
	- 男性看到对男性而言 ctr 最高的商品；
	- 女性看到对女性而言 ctr 最高的商品；
---
#### 再进阶一下：精细化运营
- 如果能将用户区分得更加精细（例如：中国东北 30～35 岁高购买力男性），类似这样的简单组合，就可以将人分为大概 700 多类。
- 推荐算法就是用类似的方法，可以自动的对上述分类进行数据驱动下的自动商品货架调整。
- 推荐中最有效的策略（i2i）是这种分类：刚刚看过某个商品的人群，对他们而言哪些商品的 ctr 更高。

---
## 算法的本质

> 第 2 节

---
### 推荐（搜索）算法的本质是学习用户的行为

---
#### 万物皆可“个性化”吗？
- 推荐系统能对彩票进行推荐吗？
	- 推荐算法学得是用户行为，而不是彩票；
	- 用户做不到的事情，算法就学不到；
- 思考：算法能学出商品的质量吗？

---
#### “学习用户行为”会发生什么？
- 为了预测用户的行为，则必须要从用户的行为中学习；
- 但如果一个场景下，用户也无法识别商品的好坏，那算法还有效吗？
	- 电商购物场景下，用户能有效识别商品的好坏吗？他们怎么识别的？
	- 算法同学说：“我的模型中考虑了客诉、物流、用户评论、DSR 等因素”，这些因素真的起作用了吗？
---
#### 帮助用户做出有效的行为
- 推荐算法有效，背后的假设：**用户行为值得学习**
- 产品设计上应当帮助用户做出有效的行为
	- 例如，辅助用户决策，将用户评论、好评率、DSR 等信息外显出来；
	- 增加点赞等丰富的用户后验的社交行为，帮助其他用户进行决策。
---
#### 用户行为都值得学习吗？
- 人都会有犯错的时候。犯错的行为不值得学习；
- 一些高门槛的领域里，大多数用户都不是资深用户，他们的行为就未必值得学习；
- 推荐系统要是学习了这种行为会怎样？
	- 推荐结果中充斥着大量标题党、牛皮癣、黄图、爆款等等；
	- 用户无从选择时，只能利用上述信息进行决策；反过来，也使此类内容更容易获得高点击；
	- 正确的做法：通过背书（例如品牌旗舰店），教会用户该看什么；

---
## 指标问题

> 第 3 节

---
#### 如何评估推荐的效果
- 推荐算法是学习过程，所以评估可以类比于考试：
	- 学得好，成绩会提升；
	- “应试教育”是存在的；
	- 不忘初心，不“唯指标”论。观察到指标的提升，还要想一想是不是效果真的提升了。

---
#### 评估结果不是一切
- 考试是衡量学习的手段，不要为了考试而学习；不要为了指标而制定策略。
- 面对指标时，不要盲目认定“这是个黑盒”便放弃了思考；成绩不好反映的是学习过程出现了问题。
- 成绩没反映出来问题也不代表没有问题

---
#### 统计数据会说谎
-----

> 如何让一个班级的成绩快速提升？

#### 开除这个班级平均分以下的学生

- 思考：
	- 算法可以引领消费升级吗？
	- 算法可以引领内容化吗？

---
#### 关于指标的误区
- 当我们考核点击率、客单价时，统计指标是否反应了我们的本意：
	- 我们希望同一拨人的指标均值得到提升；
	- 更准确的，我们期待人的成长，而不是数据的增长。不加限制（例如有些人流失了）的点击率提升证明不了任何事情。
	- 也回顾前面的话题：任何人群的指标增长都能证明业务的提升吗？例如作弊人群？新用户（无产品心智）人群？

---
#### 算法被应用时也需要小心

> 推荐算法不以改变用户为目标

- 我们希望学生学会更多知识，进而提升了成绩：
	- 教育工作者的重点会考察学生还有哪些知识没掌握，然后教会学生；
	- 算法会找出最容易考高分的卷子来提升成绩；
	- 短期内，算法指导得成绩一定更好，甚至任何时候互换老师（AB 测试），算法的成绩都更高；
	- 但算法无法指导学生变得更好。
---
## 总结
---
### 本文要点
- 算法是工具，需要人来使用好这个工具；
- 算法的基本原理：统计当前场景下，对于不同细分人群，怎样的推荐结果指标更好；
- 算法的本质：学习用户行为！用户不懂的，算法也学不会。
- 指标问题：算法是唯指标论的，但人不是。需要人把控算法，而不是算法控制人。

---
#### 算法在场景中应用的要点
- 场景要解决用户什么问题？这个问题是否可以通过学习用户行为而习得？值得学习哪些用户行为？
- 这件事用什么指标评估？需要哪些限定条件？除了指标，还有没有其他的佐证方式？
- 项目的不同阶段需要不同的指标和做法，不盲目使用算法，同算法工程师沟通清楚需求。

---
#### 最后的一个小问题

> 如果产品经理的 KPI 和 算法工程师的 KPI 是一样的，那产品和算法究竟应该听谁的？