• AI大数据统计《庆余年2》中的小人物有哪些?


    《庆余年2》除了主角表演经常,每个配角小人物也很出彩。那到底有哪些小人物呢?

    在deepseek中输入提示词:

    你是一个Python编程专家,要写一个Python脚本,具体步骤如下:

    读取文档:"D:\qyn\庆余年第二季剧情.docx";

    使用jieba进行中文分词,

    遍历分词结果,筛选出标签为'nr'的词语(这些就是人名),打印出来;

    统计每个人名在文档中出现的次数,打印出来;

    筛选出出现次数大于10的人名,用matplotlib绘制一个水平柱状图:x轴为人名,y轴为人名出现次数;

    x轴上的人名要按照出现次数,从小到大排列;

    设置matplotlib默认字体为'SimHei',文件路径为:C:\Windows\Fonts\simhei.ttf

    注意:每一步都要输出信息到屏幕上

    源代码:

    import docx

    import jieba

    import jieba.posseg as pseg

    import collections

    import matplotlib.pyplot as plt

    from matplotlib.font_manager import FontProperties

    # 设置matplotlib默认字体

    font_path = r"C:\Windows\Fonts\simhei.ttf" # SimHei字体文件路径

    font_prop = FontProperties(fname=font_path)

    plt.rcParams['font.sans-serif'] = font_prop.get_name()

    plt.rcParams['axes.unicode_minus'] = False

    # 读取文档

    doc_path = r"D:\qyn\庆余年第二季剧情.docx"

    doc = docx.Document(doc_path)

    # 使用jieba进行中文分词,并提取人名

    text = ' '.join([para.text for para in doc.paragraphs])

    words = pseg.cut(text)

    person_names = [word for word, flag in words if flag == 'nr']

    # 输出所有的人名

    print("所有的人名:")

    print(person_names)

    # 统计每个人名在文档中出现的次数,并打印出来

    name_counts = collections.Counter(person_names)

    print("每个人名出现的次数:")

    print(name_counts)

    # 筛选出出现次数大于10的人名

    filtered_names = {name: count for name, count in name_counts.items() if count > 10}

    # 按照出现次数对filtered_names进行排序

    sorted_filtered_names = dict(sorted(filtered_names.items(), key=lambda item: item[1]))

    # 使用matplotlib绘制一个水平柱状图,x轴为人名,y轴为人名出现次数

    names_list = list(sorted_filtered_names.keys())

    counts_list = list(sorted_filtered_names.values())

    # 创建图表并设置大小

    plt.figure(figsize=(10, len(names_list) // 3))

    # 绘制水平柱状图

    plt.barh(range(len(names_list)), counts_list, color='skyblue', tick_label=names_list)

    # 设置图表标题和轴标签

    plt.title('出现次数大于10的人名统计')

    plt.xlabel('人名出现次数')

    plt.ylabel('人名')

    # 显示图表

    plt.tight_layout()

    plt.show()

    程序运行,结果如上,可见,除了主角'范闲'、 '李承泽'、'陈萍萍'、'林婉儿'、 '范思辙'、 '林若甫'、'王启年'、'李承乾等这些,还有众多小人物:'叶灵儿': 49, '赖名成': 48, '言冰云': 46, '杨万里': 43, '郭铮': 40, ', '邓子越': 37, '李成儒': 35, '谢必安': 34, '明青达': 33, '柳如玉': 32, '袁梦': 27, '贺宗纬': 27, '老太太': '李承儒': 23, '袁宏道': 21, '李太医': 20, '桑文': 19, ''林珙': 18, '明家': 17, '洪竹': 16, '侯季常': 15, '郭保坤': 12, '费介': 12, , '秦恒': 10, '宜贵嫔': 10, '言若海':, '叶重': 10, '公子哥': 9, '王夫人': '肖恩': 8, '范闲才': 8, '向庆帝': 8, '郭保': 6, '成佳林':': '辛其物':

    很多出场次数很少的小人物,比如桑文、辛其物、洪竹,人物塑造鲜明,给人印象深刻。

  • 相关阅读:
    老婆
    9.spark自适应查询-AQE之动态调整Join策略
    【网页设计】期末大作业html+css(体育网站)--杜丹特篮球介绍8页 带报告
    一名优秀的测试工程师需要具备哪些技能?
    代码随想录笔记_哈希_219存在重复元素II
    Leetcode 易错题整理(三)73. 77. 78. 81. 90. 95.105. 130.
    Go实战学习笔记-1.2基础语法:变量、常量、包、指针等
    VMware 虚拟机里连不上网的解决方案
    企业电子招标采购系统源码Spring Boot + Mybatis + Redis + Layui + 前后端分离 构建企业电子招采平台之立项流程图
    上周热点回顾(5.2-5.8)
  • 原文地址:https://blog.csdn.net/AIGCTribe/article/details/139457740