机器学习 | 四大常用机器学习Python库介绍 - 码农知识堂

机器学习 | 四大常用机器学习Python库介绍
今天这篇我们介绍下Python中常用的机器学习库(机器学习、深度学习啥的，小编还是建议使用Python进行建模编写哈)，也算是本公号机器学习的第一篇推文，主要内容如下：
- 机器学习常用四大Python库
- 关于机器学习的我想说的话
- 所有完整代码都已整理之我们的线上课程，有需要的同学+v yidianshuyulove 咨询
深度学习常用四大Python库

这一部分我们简单介绍下Python中的常用的机器学习库，算是比较入门的介绍哈，具体包括Scikit-learn、Keras、TensorFlow和PyTorch，下面我们就一一简单介绍：

Scikit-learn
1. 「官网」
网址：https://scikit-learn.org/stable/
1. 「简单介绍」
Scikit-learn(sklearn)是机器学习中常用的第三方模块，其对常用的机器学习方法进行了封装，具体包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering)等方法。主要特点：
- 简单高效的数据挖掘和数据分析工具
- 够在复杂环境中重复使用
- 建立NumPy、Scipy、MatPlotLib之上
1. 「官方样例及示图」
- Classification(分类)
Classification
- Regression(回归)
Regression
- Clustering(聚类)
Clustering

更多内容，小伙伴们可参考上方官网哈

Keras

这个库也是小编较常使用的深度学习库，其高度集成式可帮助你快速搭建深度学习网络。值得一提的是，官方也提供了对应的中文网站哦，帮助大家更好的理解。
1. 「官网」
网址：https://keras.io/zh/
1. 「简单介绍」
Keras是一个由Python编写的开源人工神经网络库，在代码结构上由面向对象方法编写，完全模块化并具有可扩展性，其运行机制和说明文档有将用户体验和使用难度纳入考虑，并试图简化复杂算法的实现难度。特点如下：
- 支持现代人工智能领域的主流算法，包括前馈结构和递归结构的神经网络，
- 可通过封装参与构建统计学习模型。
- 支持多操作系统下的多GPU并行计算。
1. 「官方样例及示图」
- 基于多层感知器 (MLP) 的 softmax 多分类：
```
import keras
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation
from keras.optimizers import SGD
 
# 生成虚拟数据
import numpy as np
x_train = np.random.random((1000, 20))
y_train = keras.utils.to_categorical(np.random.randint(10, size=(1000, 1)), num_classes=10)
x_test = np.random.random((100, 20))
y_test = keras.utils.to_categorical(np.random.randint(10, size=(100, 1)), num_classes=10)
 
model = Sequential()
# Dense(64) 是一个具有 64 个隐藏神经元的全连接层。
# 在第一层必须指定所期望的输入数据尺寸：
# 在这里，是一个 20 维的向量。
model.add(Dense(64, activation='relu', input_dim=20))
model.add(Dropout(0.5))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation='softmax'))
 
sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='categorical_crossentropy',
              optimizer=sgd,
              metrics=['accuracy'])
 
model.fit(x_train, y_train,
          epochs=20,
          batch_size=128)
score = model.evaluate(x_test, y_test, batch_size=128)
```
- 基于多层感知器的二分类
```
import numpy as np
from keras.models import Sequential
from keras.layers import Dense, Dropout
 
# 生成虚拟数据
x_train = np.random.random((1000, 20))
y_train = np.random.randint(2, size=(1000, 1))
x_test = np.random.random((100, 20))
y_test = np.random.randint(2, size=(100, 1))
 
model = Sequential()
model.add(Dense(64, input_dim=20, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(1, activation='sigmoid'))
 
model.compile(loss='binary_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])
 
model.fit(x_train, y_train,
          epochs=20,
          batch_size=128)
score = model.evaluate(x_test, y_test, batch_size=128)
```
- 基于 LSTM 的序列分类
```
from keras.models import Sequential
from keras.layers import Dense, Dropout
from keras.layers import Embedding
from keras.layers import LSTM
 
max_features = 1024
 
model = Sequential()
model.add(Embedding(max_features, output_dim=256))
model.add(LSTM(128))
model.add(Dropout(0.5))
model.add(Dense(1, activation='sigmoid'))
 
model.compile(loss='binary_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])
 
model.fit(x_train, y_train, batch_size=16, epochs=10)
score = model.evaluate(x_test, y_test, batch_size=16)
```
通过以上样例可以发现，只需简单的集成化操作就可以构建出浅层甚至多层的神经网络模型，还是十分方便的。更多样例和操作方法，大家可参考官网哈~~

TensorFlow
1. 「官网」
网址：https://tensorflow.google.cn/
1. 「简单介绍」
TensorFlow是一个开放源代码软件库，用于进行高性能数值计算，是一个用于研究和生产的开放源代码机器学习库。其提供了各种 API，可供初学者和专家在桌面、移动、网络和云端环境下进行开发，采用数据流图（Data Flow　Graphs）来计算。
1. 「官方样例」 TensorFlow 官网提供详细而全面的教程和应用文章，大家可前往阅读。
PyTorch

其实这个库吧，在我刚接触深度学习时还不是特别大众化，但在我快毕业时，其越来越被接受和使用，我想这与其可高度自定义化操作特点有关。
1. 「官网」
网址：https://pytorch.org/
1. 「简单介绍」
PyTorch是一个开源的Python机器学习库，基于Torch，用于自然语言处理等应用程序。2017年1月，由Facebook人工智能研究院（FAIR）基于Torch推出了PyTorch。它是一个基于Python的可续计算包，提供两个高级功能：
- 具有强大的GPU加速的张量计算（如NumPy）。
- 包含自动求导系统的深度神经网络。
「特点如下：」
- PyTorch是相当简洁且高效快速的框架。
- 设计追求最少的封装。
- 设计符合人类思维，它让用户尽可能地专注于实现自己的想法。
- 与google的Tensorflow类似，FAIR的支持足以确保PyTorch获得持续的开发更新。
- PyTorch作者亲自维护的论坛供用户交流和求教问题。
- 入门简单。
1. 「官方样例」
- TRAINING A CLASSIFIER(分类训练)
网址：https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html#sphx-glr-beginner-blitz-cifar10-tutorial-py
- TORCHVISION OBJECT DETECTION FINETUNING TUTORIAL(目标检测)
网址：https://pytorch.org/tutorials/intermediate/torchvision_tutorial.html

Mask R-CNN adds an extra branch into Faster R-CNN, which also predicts segmentation masks for each instance.

更多优秀案例，大家可阅读PyTorch官网。

关于机器学习的我想说的话

其实对于机器学习或者深度学习，小编的建议还是熟练掌握Scikit-learn、Keras以及PyTorch，这里不是要求掌握到自己熟练编写网络层，但要对其原理有所了解，使自己可以对其进行简单的修改。因为我们实际工作中用到的模型早已经成熟或者开源，大家完全可以去Github上进行下载和解读。但对一些科研需求，则需要自己进行代码修改甚至相关网络层的编写。本公号后续推出的机器学习相关推文也会从简至难，也会有完整的流程化步骤帮助大家更好地将理论应用到实际上。

最后，给正在追求精度的模型小伙伴说句话：“这玩意吧~精度和结果有时候真得看运气~~”，具体原因就不说了，有经验的我们会心一笑即可~~
相关阅读:
年搜索量超 7 亿次背后：这款 APP 用火山引擎 DataTester 完成“数据驱动”
SpringCloud框架（三）：微服务优化，Feign的最佳实现方案
 umich cv-1
基于Labview的图像傅里叶变换研究-含Labview程序
 Jenkins部署springboot项目至远程服务器
 位逻辑运算符
 剑指 Offer II 024. 反转链表
 从0开始启动一个Django的docker服务
 C++ 类的继承（Inheritance)
一个引发openssl崩溃问题案例
原文地址：https://blog.csdn.net/qq_40483688/article/details/136449412

机器学习 | 四大常用机器学习Python库介绍

深度学习常用四大Python库

Scikit-learn

Keras

TensorFlow

PyTorch

关于机器学习的我想说的话