• 第一章-新手上路


    1.1.1 词汇量

    讲的就是词汇量很多

    1.1.2 结构化

    明确的结构关系

    1.1.3 歧义性

    1.1.4 容错性

    1.1.5 易变性

    1.1.6 简略性

    1.2.1 语音、图像和文本

    输入源3个,语音、图像、文本

    1.2.2 中文分词、词性标注、命名实体识别

    3个任务都是围绕词语进行分析,词法分析

    中文分词:将文本分割成有意义的词语
    词性标注:确定每个词语的类别和浅层的歧义消除
    命名实体识别:识别出一些较长的专有名词

    文本分类:分门别类的进行整理
    文本聚类:相似的文本归档到一起,或者排除重复的文档,而不关心具体类别

    pyhanlp 下载问题

    pip install pyhanlp
    Looking in indexes: https://mirrors.aliyun.com/pypi/simple/
    Collecting pyhanlp
      Using cached https://mirrors.aliyun.com/pypi/packages/d2/fa/19ca69e0b94bbd9fed93272e5952d2308c13688647fac779a52729fa801f/pyhanlp-0.1.84.tar.gz (136 kB)
      Preparing metadata (setup.py): started
      Preparing metadata (setup.py): finished with status 'error'
      error: subprocess-exited-with-error
      
      × python setup.py egg_info did not run successfully.
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    K最近邻算法的用法

    # 导入数据生成器
    from sklearn.datasets import make_blobs
    from sklearn.neighbors import KNeighborsClassifier
    import matplotlib.pyplot as plt
    from sklearn.model_selection import train_test_split
    
    # 生成样本数为200,分类为2的数据集
    data = make_blobs(n_samples=200,centers = 2,random_state=8)
    x,y=data
    plt.scatter(x[:,0],x[:,1],c=y,cmap=plt.cm.spring,edgecolor='k')
    plt.show()
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    运用make_blobs生成的数据集已经有两类

    在这里插入图片描述

    面向对象概念

    类对象

    class 类名:
    类体

    描述状态的数据成员(属性)和描述操作的函数成员(方法)

    class Person1:
        pass
    
    # 创建和使用类对象
    p1 = Person1()
    print(Person1,type(Person1),id(Person1))
    print(p1,type(p1),id(p1))
    
    # class语句实际上就是python的符合语句,python解释器解释执行class语句时会创造一个类对象
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    D:\soft\anaocanda\envs\ssj\python.exe D:/info/code/pythonProject1/2.py
    <class '__main__.Person1'> <class 'type'> 1759481755120
    <__main__.Person1 object at 0x00000199A9357760> <class '__main__.Person1'> 1759480477536
    
    进程已结束,退出代码0
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    类时抽象的,如果要使用类定义的功能,就必须实例化类,即创建类的对象。
    在创建实例对象后,可以使用"." 运算符来调用其成员

    创建类的对象
    创建类的实例
    实例化类
    这些说法都是等价的

    anobject = 类名(参数列表)
    anobject.对象函数 或者 anobject.对象属性

    Python创建实例对象的方法并不用new

    self.实例变量名 = 初始值

    self.实例变量名 = 值
    这是写入
    self.实例变量名
    这是读取

  • 相关阅读:
    JupyterHub
    CDGA数据治理工程师考试心得
    MySQL的安装&SQL语句操作
    07-Linux基本权限
    WPF中使用Path绘制图形基础
    FEDformer 代码分析(2)
    POD创建与删除简单描述
    离线 notepad++ 添加到右键菜单
    基于JAVA的股票交易管理系统-计算机毕业设计
    Linux 基本语句_7_C语言_文件I/O文件复制操作
  • 原文地址:https://blog.csdn.net/weixin_44522477/article/details/127415218