机器学习近年来发展迅速,那什么是机器学习呢?
其实机器学习在我们每天的生活、 工作中都随处可见机器学习的应用。比如你每天打开手机,无论是打开短视频软件,还是逛购物软件,这些里面都是包含机器学习的算法推荐你感兴趣的内容。
关于机器学习的定义常见的有以下三个:
(1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
(2)机器学习是对能通过经验自动改进的计算机算法的研究。
(3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。
实际上,即使是在机器学习的专业人士中,也不存在一个被广泛认可的定义来准确定义机器学习是什么或不是什么。
通过阅读以上定义,我们可以大致了解,机器学习其实就是从已有的经验(数据)中学习或训练,从而对未知的数据做一个预测与判断。
如何对数据进行学习与预测,就是最重要的机器学习算法了,机器学习一般可以分为有监督学习与无监督学习。
有监督学习:是根据已知的输入和输出数据来训练模型,进而预测未来的输出。常见的有分类与回归这两种类型的算法。例如常见的分类算法有SVM,KNN,贝叶斯等;常见的回归算法有神经网络回归,决策树回归,SVM回归,随机森林回归等。
无监督学习:无需训练,发现输入数据中的隐藏模式或内在结构。常见的是一些聚类算法。例如K-means,DBSCAN,GMM,PCA等。
详细介绍请看后续内容。