作者:云南 陈建华 基本概念 监督学习(supervised learning):给定的训练集有类别标记(class label) 无监督学习(unsupervised learning):给定的训练集没有类别标记 半监督学习(semi-supervised learning):介于以上两者之间,给定的训练集部分有类别标记,部分没有类别标记 训练集(training data):训练样例,也就是喂食动物需要的材料 测试集(testing data):用来测试评估的数据,是骡子是马拉出来溜溜的试金石 分类(classification):目标标记为类别型的数据 回归(regression):目标标记为连续性的数值 标记(label):一条数据类别的标记,input标签前面就有个label 特征值(feature):实例的某一个特征属性。一堆属性的集合叫做特征向量(features)
机器学习类型:
1)有监督学习(supervised learning):训练集有类别标记。
2)无监督学习(unsupervised learing):无类别标记。
3)半监督学习(semi-supervised learning):有类别标记的训练集+无类别标记的训练集。
机器学习步骤框架:
1) 把数据拆分为训练集和测试集
2) 用训练集和训练集的特征向量来训练算法
3) 用学习来的算法运用在测试集上来评估算法
机器学习中分类和预算算法的评估:
1) 准确率
2) 速度
3) 强壮化
4) 可规模性
5) 可解释性
机器学习是人工智能一个子集,人工智能并不一定需要机器学习,例如路径搜索等