• 敏感词检测库ToolGood.Words中 WordsHelper类使用简介


      C#开源敏感词检测库ToolGood.Words中的类WordsHelper为文本辅助操作类,支持繁体简体互换、全角半角互换、数字转成中文大写、拼音操作等功能,本文对照参考文献1,对该类的用法进行简要介绍。
      WordsHelper类中主要的辅助函数如下表所示:

    序号名称说明
    1GetAllPinyin获取单个字符的所有拼音,本函数主要针对多音字,能够返回字符所有的拼音集合,如“好”返回Hao,“查”返回cha和zha。本函数还支持带声调返回,更利于生僻字拼读。
    2GetFirstPinyin获取字符串中每个字符的首字母集合,如“我是中国人”返回WSZGR
    3GetPinyin函数形式为string GetPinyin(string text, bool tone = false),获取字符串中每个字符的拼音全拼集合,如“我是中国人”返回WoShiZhongGuoRen,支持带声调返回,如WǒShìZhōngGuóRén
    4GetPinyin函数形式为string GetPinyin(string text, string splitSpan, bool tone = false),该函数与上一函数为重载函数,唯一区别是支持以指定字符分割每个字符的拼音全拼,如“我是中国人”返回Wo,Shi,Zhong,Guo,Ren
    5GetPinyinList获取字符串中每个字符的拼音全拼,以数组形式返回
    6GetPinyinForName获取字符串中每个字符的拼音全拼,优先选用姓氏的拼音,如“查文斌“,本函数返回ZhaWenBin,而GetPinyin 返回ChaWenBin
    7GetPinyinForName上一函数的重载函数,唯一区别是支持以指定字符分割每个字符的拼音全拼
    8GetPinyinListForName获取字符串中每个字符的拼音全拼,优先选用姓氏的拼音,以数组形式返回
    9HasChinese判断字符串中是否包含中文
    10IsAllChinese判断字符串中是否全中文
    11HasEnglish判断字符串中是否包含英文
    12IsAllEnglish判断字符串中是否全英文
    13ToSBC半角转全角
    14ToDBC文字转半角
    15ToTraditionalChinese函数形式为string ToTraditionalChinese(string text, int type = 0), 简体转繁体,支持转为多种类型的繁体,包括0、繁体中文,1、港澳繁体,2、台湾正体
    16ToSimplifiedChinese函数形式为string ToSimplifiedChinese(string text, int srcType = 0),繁体转简体,支持将多种类型的繁体转为简体,包括0、繁体中文,1、港澳繁体,2、台湾正体
    17ToChineseRMB将阿拉伯数字转为中文人民币的形式
    18ToNumber将中文人民币形式的文本转为阿拉伯数字

      根据上述函数定义,设计并开发了WordsHelper类的使用测试程序,同时结合之前学习的.net文字转语音模块System.Speech,在文字转拼音时能自动朗读文字,测试程序比较简单,就不再这里列出来了,程序的运行效果如下:
    在这里插入图片描述

      测试代码放在了GitHub上,地址为https://github.com/guochao2299/TestToolGoodWords,后续还会继续学习该库的用法(不过该开源项目已经停更了,已经在GitHub的代码注释中说明)。

    参考文献:
    [1]https://github.com/toolgood/ToolGood.Words

  • 相关阅读:
    MySQL进阶实战4,那些年学过的索引,下篇
    linux 下 java环境安装
    基于隐私保护计算的金融科技创新探索
    跟着野火从零开始手搓emWin(2)emWin 在 Windows 上仿真
    基于智能优化算法的交通流模拟器(Matlab代码实现)
    java -非空判断
    机器学习笔记 - Kornia:结合OpenCV的PyTorch框架
    数字 IC 设计、FPGA 设计秋招笔试题目、答案、解析(2)2021 华为海思(上)
    C++ 多态和虚函数详解
    java毕业生设计专利查询与发布系统设计与实现计算机源码+系统+mysql+调试部署+lw
  • 原文地址:https://blog.csdn.net/gc_2299/article/details/127956810