《统计学习方法》阅读笔记及代码实现-Ch2

《统计学习方法》第二章-感知机的一些笔记，包含个人的一些小见解

请注意，本文编写于 2674 天前，最后修改于 2311 天前，其中某些信息可能已经过时。

0. 前言

寒假参加夏令营的时候，老师就说过深度学习其实最开始的原型就是感知机，不过是多加了一些层而已。虽然不知道多加了几层为什么work，但是它的效果就是比传统的可证明的方法来的好，这也掀起了如今的AI狂潮 + 深度学习遍地走，你如果不会点机器学习算法，估计是招不到研究生的(玩笑话..并且机器学习也只是一种工具而已，没有那么玄乎其神)。一定要好好的钻研最经典的算法，从中汲取到养分，才能拥有核心的竞争力。在知乎上看到有关AI热的讨论，我也想说说我的理解：AI现在逐渐沦陷为一种劳动密集型产业，大部分的”调参专家“处于最底层，他们不清楚这样调参为什么work，为什么improve，但是他们总是能在结果看起来更好的时候编造一个像样的理由(私以为神经网络，深度学习等等的取名也是这样，以脑神经网络的来强行解释这个模型)。随着时代的发展，他们也是并不可少的一类人群，AI会不会凉我不知道，但是历史的浪潮会把有真才实学的人群推到最耀眼的地方，以上。之前和天凡聊天他也说过在焦虑夏令营和老师套磁的事情，做CV还是NLP，过了几天(据说是经过赵神和想神的洗脑)，他近乎是用吼出来的对我说了句:"AI已死，系统当立"，今天和赵神聊了聊他也说分布式好，哎我现在倒是想的很简单，经过了数学建模的洗礼，我总觉得数据科学是一类非常实用的学科，掌握数据挖掘的一些工具总是没错的，我也不确定自己做不做学术已经能不能做学术，但是踏踏实实地推些公式，学点技能点总是没错的，最近的事情还是很烦心，俱乐部招新的宣传工作又得我来操办了，该死，又给自己揽了不少锅，又有预备党员需要写的学习心得，还有周末的一个去玩的小比赛，今天上嵌入式的课也是完全一头雾水，下来得补补课，学术图谱的代码还没调通，老师想要的demo我可能还做不出来...每天还困得不行，晚上还上闲鱼淘点生产力工具(主机键盘surface)，大学生活真是充实的不行了！冲冲冲，大一大二年轻的时候不懂事，现在不能再这样搞下去喽

之前看到一篇推送采访了一些大牛问他们觉得最优雅的算法是什么，感知机算法和逻辑回归算法被大牛们颇为推崇，那么巧妙的收敛，那么优美的证明让我也对他有了一些好奇，读完第二章，还是有些收获的，将笔记记录在此

附上传送门：Quora上的大牛们最喜欢哪种机器学习算法?

1. 第二章感知机

1.1 感知机模型

感知机(perceptron)是二类分类的“线性分类模型”，其输入为实例的特征向量，输出为实例的类别，取+1和-1二值.感知机对应于输入空间（特征空间）中将实例划分为正负两类的分离超平面，属于判别模型．感知机学习旨在求出将训练数据进行线性划分的分离超平面，为此，导入基于误分类的损失函数，利用梯度下降法对损失函数进行极小化求得感知机模型感知机学习算法具有简单而易于实现的优点，分为原始形式和对偶形式感知机预测是用学习得到的感知机模型对新的输入实例进行分类