
A. AI/机器学习/深度学习
AI是目的,机器学习是手段,深度学习是机器学习其中一种方法
B.机器学习是什么?


C.Learning path

C1 监督学习:
INPUT :大量资料
OUTPUT: 人工标注 (label)
C11任务:
回归/分类/结构化学习
分类:下围棋,可以看作十九乘十九个类别的分类问题
结构化学习:OUTPUT:结构性的对象(比如句子/分辨图片的结构)
C12 模型:
线性模型/非线性模型
非线性:SVM / deep learning/ decision tree/...
C2 半监督学习
OUTPUT 既有labelled 又有 unlabeled (对学习也可能有用)
C3 迁移学习
OUTPUT 既有labelled 又有 unlabeled 以及其他不相干资料 (对学习也可能有用)
C4 无监督学习
INPUT :大量资料
OUTPUT: 无
C5 强化学习
VS监督学习(训练过程中):INPUT, OUTPUT:正确答案
强化学习(训练过程中):INPUT,OUTPUT:分数(做的好/不好)
若我们用Alpha Go当做例子时,supervised learning就是告诉机器:看到这个盘式你就下“5-5”,看到这个盘式你就下“3-3”
reinforcement learning的意思是:机器跟对手互下,机器会不断的下棋,最后赢了,机器就会知道下的不错,但是究竟是哪里可以使它赢,它其实是不知道的。我们知道Alpha Go其实是用监督学习加上reinforcement learning去学习的。先用棋谱做监督学习,然后在做reinforcement learning,但是reinforcement learning需要一个对手,如果使用人当对手就会很让费时间,所以机器的对手是另外一个机器。
图片,资料来自李宏毅《机器学习》










