机器学习笔记——01.定义和部分概念
什么是机器学习?
众所周知我们人类的学习能力在自然界中是顶端的存在(要不然也不可能占用这么多自然资源),对于计算机来说更是如此。当然计算机有它的有点,比如,算的比人快比人准、储存数据大……但计算机本身的学习能力可以说是0,为了利用好计算机的优点,让计算机有学习能力(让人少干点活,归结到底就是人懒)慢慢的聪明的人们就搞出了能让计算机自己学习的算法,叫做“机器学习”。
我们人类学习的过程可以说是一种“经验学习”的过程,也就是说,我们根据自己已有的经历,总结出一些规律或者经验,在面对差不多的问题时能够给出答案。根据人类学习的过程,我们为计算机构想出了适合它的学习过程:根据已有的“数据”和“结果”我们让计算机总结出一个“模型”,根据这个模型,在新的数据出现时,能给出答案。这些“数据和结果”就是我们人类的“经验”,“模型”就是人类的判断“准则”和“规律”。
机器学习的算法分类?
机器学习的基本术语
- 数据集:所有记录的集合
- 样本(示例):每一条记录
- 特征/属性:反映事件或对象在某方面的表现或性质的事项
- 属性空间/样本空间/输入空间/特征向量:所有属性张成的空间(比如:对于西瓜,颜色、大小、花纹是它的属性,而这三个属性放一起,分别对应x,y,z三个轴,就变成了空间)
- 训练:计算机学习出模型的过程
- 训练数据:训练过程种需要的数据
- 训练集:训练数据的集合
归纳与演绎
- 归纳:是从特殊到一般的“泛化”过程,即从具体的事件中推出一般的规律。从样例中学习
- 演绎:是从一般到特殊的“特化”过程,即从基础原理推演出具体状况。
假设空间与版本空间
- 假设空间:一个问题所有可能性组成的集合
- 版本空间:和训练集中样本相等的假设空间的子集
归纳偏好
对于同一个问题,计算机学习出来的模型可能有很多种,但总要选出一种来,这我们就要设置我们的归纳偏好。这一步很重要。同时,如何设置我们的归纳偏好也相当“有意思”
- 本文作者: Doted Wood
- 本文链接: http://example.com/2021/10/02/ML/机器学习——01/
- 版权声明: 版权归博主所有,转载请说明来源