|
训练方式
|
机器学习算法
|
深度学习算法
|
NLP的应用
|
文本的处理
|
方法、技术、算法
| |||
|
监督Supervised
|
线性回归
|
CNN卷积神经网络
|
聊天机器人
|
一、文本处理方法
|
文本预处理
| |||
|
监督
|
逻辑回归
|
GANS生成对抗网络
|
问答系统
|
分词
| ||||
|
监督
|
线性判别分析
|
RL深度强化学习
|
情感分析/分类
|
标注词性
| ||||
|
监督
|
决策树
|
机器翻译
|
实体提取NER
| |||||
|
监督
|
朴素贝叶斯
|
LSTM长短期记忆网络
|
自动摘要
|
过滤停用词
| ||||
|
监督
|
K邻近
|
Transformer
|
信息抽取NER
|
二、文本表示方法
|
人类语言转成化计算机语言,词嵌入/词向量 WordEmbeding
| |||
|
监督
|
学习向量量化
|
Bert
|
文本分类
|
One-hot独热编码
| ||||
|
监督
|
支持向量机
|
GPT
|
count verctor/TF(计数向量)
| |||||
|
监督
|
随机森林
|
XL-NET等
| ||||||
|
监督
|
AdaBoost
|
Embedding词向量:word2vec是主流的实现方法,另一种是Glove
| ||||||
|
非监督Unsupervised
|
高斯混合模型
|
三、语言模型
| ||||||
|
非监督
|
限制玻尔兹曼机
|
基于规则
|
专家系统,波特词干
| |||||
|
非监督
|
K-means聚类
|
基于机器学习应用
或称统计学习方法
|
隐马尔可夫模型HMM,感知机,条件随机场CRF,朴素贝叶斯,支持向量机SVM
| |||||
|
非监督
|
最大期望算法
|
基于深度学习应用
|
RNN,LSTM,word2vec,
Transformer,Bert,GPT.....
| |||||
|
强化学习
|