陈建华的个人网站

机器学习之路(1)

  • Jet Chen
  • 2015-04-24
  • 0
作者:云南 陈建华
基本概念
监督学习(supervised learning):给定的训练集有类别标记(class label)
无监督学习(unsupervised learning):给定的训练集没有类别标记
半监督学习(semi-supervised learning):介于以上两者之间,给定的训练集部分有类别标记,部分没有类别标记
训练集(training data):训练样例,也就是喂食动物需要的材料
测试集(testing data):用来测试评估的数据,是骡子是马拉出来溜溜的试金石
分类(classification):目标标记为类别型的数据
回归(regression):目标标记为连续性的数值
标记(label):一条数据类别的标记,input标签前面就有个label
特征值(feature):实例的某一个特征属性。一堆属性的集合叫做特征向量(features)

机器学习类型:
1)有监督学习(supervised learning):训练集有类别标记。
2)无监督学习(unsupervised learing):无类别标记。
3)半监督学习(semi-supervised learning):有类别标记的训练集+无类别标记的训练集。

机器学习步骤框架:
1) 把数据拆分为训练集和测试集
2) 用训练集和训练集的特征向量来训练算法
3) 用学习来的算法运用在测试集上来评估算法

机器学习中分类和预算算法的评估:
1) 准确率
2) 速度
3) 强壮化
4) 可规模性
5) 可解释性

机器学习是人工智能一个子集,人工智能并不一定需要机器学习,例如路径搜索等


© 2023 陈建华的个人网站
Theme by Wing
  • {{ item.name }}
  • {{ item.name }}