机器学习按学习模式的四种分类
按照学习模式的不同,机器学习可分为监督学习、无监督学习、半监督学习、强化学习。其中,监督学习需要提供标注的样本集,无监督学习不需要提供标注的样本集,半监学习需要提供少量标注的样本,而强化学习需要反馈机制。
1. 监督学习
监督学习是利用已标记的有限训练数据集,通过某种学习策略/方法建立一个模型,从而实现对新数据/实例的标记(分类)/映射。监督学习要求训练样本的分类标签已知,分类标的精确度越高,样本越具有代表性,学习模型的准确度越高。目前,监督学习在自然语言处理信息检索、文本挖掘、手写体辨识、垃圾邮件侦测等领域获得了广泛应用。最典型的监督学习算法包括回归和分类等。
2. 无监督学习
无监督学习是利用无标记的有限数据描述隐藏在未标记数据中的结构/规律。无监督学习不需要以人工标注数据作为训练样本,这样不仅便于压缩数据存储、减少计算量、提升算法速度,还可以避免正负样本偏移引起的分类错误问题。无监督学习主要用于经济预测、异常检测、数据挖掘、图像处理、模式识别等领域,例如组织大型计算机集群、社交网络分析、市场分割、天文数据分析等。无监督学习常见算法包括Apriori 算法、KMeans算法、随机森林、主成分分析等。
3. 半监督学习
半监督学习介于监督学习与无监督学习之间,可以利用少量的标注样本和大量的未标识样本进行训练和分类,从而达到减少标注代价、提高学习能力的目的。半监督学习的应用场景包括分类和回归,算法包括一些常用监督学习算法的延伸,这些算法首先试图对未标识数据进行建模,在此基础上再对标识的数据进行预测。例如,图论推理算法或者拉普拉斯支持向量机等。
4. 强化学习
强化学习可以学习从环境状态到行为的映射,使得智能体选择的行为能够获得环境的最大奖赏,最终目标是使外部环境对学习系统在某种意义下的评价最佳。由于外部环境提供的信息很少,强化学习系统必须靠自身的经历进行学习。目前,强化学习在机器人控制、无人驾驶、工业控制等领域获得成功应用。强化学习的常见算法包括 Q-Learning、时间差学习等。