• 文本词频统计的应用——以微词云平台为例


    词频分析(Word Frequency Analysis):对一文本数据中某词汇出现的次数进行统计与分析,是文本挖掘的重要手段。词频分析也是数据分析和挖掘的重要方式,而结果通常以词云图的形式输出。

    词频分析通常结合Python等一起使用,常见于商品分析等。其实,我们也可以对文本信息进行词频分析,从而把握其中的中心思想或是关键信息。同时,也有许多平台和工具可以实现零代码和在线进行词频分析。这里我们以微词云为例,介绍如何使用微词云对一篇文章进行词频分析。

    首先,按照惯例,我们给出网址:

    微词云:www.weiciyun.com

    进入首页,我们选择【文本词频统计】这一模块

    接下来,完成内容的输入或导入:我们可以直接将文本粘贴在文本框中,或是以txt/excel的形式导入文件。这里我们选择复制粘贴《再别康桥》原文。

    在这里我们也可以根据需要自定义词典或是设置同义词。确认无误后,点击下一步。此时,弹窗提醒是否去重,根据实际需要选择即可。(这里我们不选择去重,点击确定)

    之后,就是一个个人十分偏爱的功能(也是本平台的一个亮点):根据文本信息得出一份多维度的分析报告,根据这份报告,我们就可以完成一些基础的数据分析工作了。

    至于如何使用和分析这些数据,就要结合具体需要而定了。一般而言,这份分析报告已足以支撑一些基础的分析工作。

    此外,我们也可以选择将词云图进行个性化设计。点击美化词云图,进行详细制作。在工作台中对其形状、字体等进行调整,以实现最佳的美化效果。之后,我们可以将词云图输出保存。

    ​更多信息:欢迎微信搜索【角砾岩队长的GIS空间】

  • 相关阅读:
    python实现线性插值
    利用ChatGPT辅助理解数学建模竞赛题目与拆解问题
    (译)TDD(测试驱动开发)的5个步骤
    【代码随想录】链表专栏(Java)
    Vite 设置 build 之后项目的相对路径,而不是绝对路径 base
    观察者模式:包工头的救赎
    算法自学__线性筛
    Vue中如何封装组件,如何进行跨组件通信
    TypeScript的使用(上)
    浅浅研究模板字符串 ` `
  • 原文地址:https://blog.csdn.net/m0_57340659/article/details/127659461