0
点赞
收藏
分享

微信扫一扫

机器学习面试题八之感知机算法


LawsonAbs的认知与思考,还请各位读者批判阅读。

总结


我会以专栏的形式写下此生学习到的每个基础ML算法

1.什么是感知机算法?

1.1 模型结构

机器学习面试题八之感知机算法_深度学习

对应的表达式就是:

机器学习面试题八之感知机算法_感知机_02

1.2 性质



属于监督学习算法
比如在后面给出的实战代码中,我们给出了人名对应的性别,会根据这个预测是否准确去完成一次更新操作。



属于迭代式算法
每次读入一个样本,执行预测,将预测结果与正确答案进行对比,计算误差,根据误差更新模型参数。



2.有什么用途?

  • 可以用于问题分类( 二类线性分类器)

3.有什么利弊?



模型过于简单
参数较少的模型就容易出现**“不拟合”**的情况,同时,也会因为数个偏离点而对迭代更新的参数有很大的影响。从而难以准确的预测结果,造成较大偏差。



迭代偏差
这里说的迭代偏差是因为我们总是倾向于取最后一次迭代的模型。
每次迭代都产生一个模型,而且每个模型的对应的每个参数不一定相同。如果我们单纯的取最后一次迭代产生的模型作为“最优模型”的话,很有可能是 “补了西墙,拆了东墙”



3.怎么改进?

针对上面叙述的问题,对应的改进方法有投票感知机和平均感知机,分别简单叙述一下。

3.1 投票感知机

3.1.1 思想

每次迭代都会产生一个不同参数的模型,那么这些模型间的准确率就不一样,把这个准确率称之为权重。根据各个模型的权重可以得到每个模型的加权平均值。根据各个模型的加权平均值与参数相乘,得到最终的一个模型。

3.1.2 缺点


  • 计算开销大
  • 存储开销大

3.2 平均感知机

3.2.1 思想

每次迭代都会产生一个不同参数的模型,最后得到的模型就取每次迭代模型的一个平均。【这个平均其实指的是模型参数的平均】【《自然语言处理入门》这本书中讲的是:取多个模型权重的平均。我不是很理解。】

3.2.2 特点


  • 好实现
  • 借助一定的方法【累积参数和,而不是傻傻的每迭代一次就算一次平均】,可以避免存储中间模型,可以以更少内存得到最终的模型



举报

相关推荐

0 条评论