第一章-新手上路

1.1.1 词汇量

讲的就是词汇量很多

1.1.2 结构化

明确的结构关系

1.1.3 歧义性

1.1.4 容错性

1.1.5 易变性

1.1.6 简略性

1.2.1 语音、图像和文本

输入源3个，语音、图像、文本

1.2.2 中文分词、词性标注、命名实体识别

3个任务都是围绕词语进行分析，词法分析

中文分词：将文本分割成有意义的词语
词性标注：确定每个词语的类别和浅层的歧义消除
命名实体识别：识别出一些较长的专有名词

文本分类：分门别类的进行整理
文本聚类：相似的文本归档到一起，或者排除重复的文档，而不关心具体类别

pyhanlp 下载问题

pip install pyhanlp
Looking in indexes: https://mirrors.aliyun.com/pypi/simple/
Collecting pyhanlp
  Using cached https://mirrors.aliyun.com/pypi/packages/d2/fa/19ca69e0b94bbd9fed93272e5952d2308c13688647fac779a52729fa801f/pyhanlp-0.1.84.tar.gz (136 kB)
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'error'
  error: subprocess-exited-with-error
  
  × python setup.py egg_info did not run successfully.
1
2
3
4
5
6
7
8
9

K最近邻算法的用法

# 导入数据生成器
from sklearn.datasets import make_blobs
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

# 生成样本数为200，分类为2的数据集
data = make_blobs(n_samples=200,centers = 2,random_state=8)
x,y=data
plt.scatter(x[:,0],x[:,1],c=y,cmap=plt.cm.spring,edgecolor='k')
plt.show()

1
2
3
4
5
6
7
8
9
10
11
12

运用make_blobs生成的数据集已经有两类

在这里插入图片描述

面向对象概念

类对象

class 类名：
类体

描述状态的数据成员（属性）和描述操作的函数成员（方法）

class Person1:
    pass

# 创建和使用类对象
p1 = Person1()
print(Person1,type(Person1),id(Person1))
print(p1,type(p1),id(p1))

# class语句实际上就是python的符合语句，python解释器解释执行class语句时会创造一个类对象

1
2
3
4
5
6
7
8
9
10

D:\soft\anaocanda\envs\ssj\python.exe D:/info/code/pythonProject1/2.py
<class '__main__.Person1'> <class 'type'> 1759481755120
<__main__.Person1 object at 0x00000199A9357760> <class '__main__.Person1'> 1759480477536

进程已结束,退出代码0

1
2
3
4
5
6

类时抽象的，如果要使用类定义的功能，就必须实例化类，即创建类的对象。
在创建实例对象后，可以使用"." 运算符来调用其成员

创建类的对象
创建类的实例
实例化类
这些说法都是等价的

anobject = 类名（参数列表）
anobject.对象函数或者 anobject.对象属性

Python创建实例对象的方法并不用new

self.实例变量名 = 初始值

self.实例变量名 = 值
这是写入
self.实例变量名
这是读取

相关阅读:
五. 激光雷达建图和定位方案-开源SLAM
交换机/防火墙-基础配置-23.10.11
皕杰报表之隐藏处理
基于 Retina-GAN 的视网膜图像血管分割
Mysql 讲解所有的约束类型
什么是驱动？驱动程序的工作原理？
程序员面试金典 - 面试题 17.20. 连续中值
chapter 01 字符串的那些事
【Spring框架】——4.依赖注入（DI）
【word格式】mathtype公式插入 | 段落嵌入后格式对齐 | 字体大小调整 |空心字体

原文地址：https://blog.csdn.net/weixin_44522477/article/details/127415218