讲的就是词汇量很多
明确的结构关系
输入源3个,语音、图像、文本
3个任务都是围绕词语进行分析,词法分析
中文分词:将文本分割成有意义的词语
词性标注:确定每个词语的类别和浅层的歧义消除
命名实体识别:识别出一些较长的专有名词
文本分类:分门别类的进行整理
文本聚类:相似的文本归档到一起,或者排除重复的文档,而不关心具体类别
pip install pyhanlp
Looking in indexes: https://mirrors.aliyun.com/pypi/simple/
Collecting pyhanlp
Using cached https://mirrors.aliyun.com/pypi/packages/d2/fa/19ca69e0b94bbd9fed93272e5952d2308c13688647fac779a52729fa801f/pyhanlp-0.1.84.tar.gz (136 kB)
Preparing metadata (setup.py): started
Preparing metadata (setup.py): finished with status 'error'
error: subprocess-exited-with-error
× python setup.py egg_info did not run successfully.
# 导入数据生成器
from sklearn.datasets import make_blobs
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
# 生成样本数为200,分类为2的数据集
data = make_blobs(n_samples=200,centers = 2,random_state=8)
x,y=data
plt.scatter(x[:,0],x[:,1],c=y,cmap=plt.cm.spring,edgecolor='k')
plt.show()
运用make_blobs生成的数据集已经有两类

class 类名:
类体
描述状态的数据成员(属性)和描述操作的函数成员(方法)
class Person1:
pass
# 创建和使用类对象
p1 = Person1()
print(Person1,type(Person1),id(Person1))
print(p1,type(p1),id(p1))
# class语句实际上就是python的符合语句,python解释器解释执行class语句时会创造一个类对象
D:\soft\anaocanda\envs\ssj\python.exe D:/info/code/pythonProject1/2.py
<class '__main__.Person1'> <class 'type'> 1759481755120
<__main__.Person1 object at 0x00000199A9357760> <class '__main__.Person1'> 1759480477536
进程已结束,退出代码0
类时抽象的,如果要使用类定义的功能,就必须实例化类,即创建类的对象。
在创建实例对象后,可以使用"." 运算符来调用其成员
创建类的对象
创建类的实例
实例化类
这些说法都是等价的
anobject = 类名(参数列表)
anobject.对象函数 或者 anobject.对象属性
Python创建实例对象的方法并不用new
self.实例变量名 = 初始值
self.实例变量名 = 值
这是写入
self.实例变量名
这是读取