• 基于大数据的高校英语现状分析


    温馨提示:文末有 CSDN 平台官方提供的学长 QQ 名片 :)

    》源代码下载:基于大数据的高校英语现状分析【毕业设计】【Python】【网络爬虫】【数据分析】【数据集+源代码+视频】-CSDN下载

    1. 项目简介

            全球化时代,英语的重要性日益凸显。现如今我国高校英语教育还存在教学形式单一、没有创新、传统模式已经不适合当今社会发展等弊端,需要制订出符合国情的教学规划,采取相对应的策略,增进教育理念,培养高素质人才。本项目利用 pandas + Matplotlib + seaborn + sklearn 等工具包对某高校各大学院学生历年的四六级数据进行多维度的统计分析,展现高校英语的现状,为英语教学改革提供精细化的分析。

    2. 四六级成绩数据读取

    1. df_202009_six = pd.read_excel('./data/2020年9月大学英语六级成绩.xls')
    2. df_202009_four = pd.read_excel('./data/2020年9月大学英语四级成绩.xls')
    3. df_202012_six = pd.read_excel('./data/2020年12月份六级成绩.xls')
    4. df_202012_four = pd.read_excel('./data/2020年12月份四级成绩.xls')
    5. df_202106_six = pd.read_excel('./data/2021年6月份英语六级成绩数据.xls')
    6. df_202106_four = pd.read_excel('./data/2021年6月份英语四级成绩数据.xls')

    3. 数据可视化探索分析

    3.1 不同学院报考的学生数量分布

    1. plt.figure(figsize=(16, 5))
    2. plt.subplot(121)
    3. ax = sns.countplot(df_202009_six['学院'], order=sorted(list(set(df_202009_six['学院']))))
    4. ax.set_xticklabels(ax.get_xticklabels(),rotation=90)
    5. plt.title('2020年9月各学院大学英语六级报考人数', fontsize=16, weight='bold')
    6. plt.subplot(122)
    7. ax = sns.countplot(df_202009_four['学院'], order=sorted(list(set(df_202009_four['学院']))))
    8. ax.set_xticklabels(ax.get_xticklabels(),rotation=90)
    9. plt.title('2020年9月各学院大学英语四级报考人数', fontsize=16, weight='bold')
    10. plt.show()

     

    3.2 各学院六级得分变化与分布情况

    3.3 各学院四级得分变化与分布情况

    3.4 各学院四六级考试弃考率变化情况

    3.5 各学院四六级得分分布箱型图

    1. xueyuan_6_dict = {k: 0 for k in set(df_202106_six['学院'])}
    2. for xueyuan in xueyuan_6_dict:
    3. xueyuan_df = df_202106_six[df_202106_six['学院'] == xueyuan]
    4. if xueyuan_df.shape[0] == 0:
    5. continue
    6. defen = xueyuan_df['总分'].values
    7. defen = defen[defen > 0]
    8. xueyuan_6_dict[xueyuan] = defen.tolist()
    9. plt.figure(figsize=(16, 10))
    10. plt.boxplot(xueyuan_6_dict.values(), labels = xueyuan_6_dict.keys())
    11. plt.title('各学院六级得分分布箱型图', fontdict={'weight':'normal','size': 20})
    12. pl.xticks(rotation=90)
    13. plt.show()

    3.6 各科目得分与总分之间的回归分析

    3.7 各学院四六级及格率统计分析

    1. xueyuan_4_dict = {k: 0 for k in set(df_202106_four['学院'])}
    2. for xueyuan in xueyuan_4_dict:
    3. xueyuan_df = df_202106_four[df_202106_four['学院'] == xueyuan]
    4. if xueyuan_df.shape[0] == 0:
    5. continue
    6. pass_df = xueyuan_df[xueyuan_df['总分'] >=425]
    7. pass_ = pass_df.shape[0]
    8. pass_ratio = pass_ * 1.0 / xueyuan_df.shape[0]
    9. xueyuan_4_dict[xueyuan] = pass_ratio
    10. print(f'{xueyuan}{pass_ratio}')
    11. xueyuan_4_dict = sorted(xueyuan_4_dict.items(), key=lambda x: x[1], reverse=True)
    12. plt.figure(figsize=(16, 6))
    13. plt.bar([x[0] for x in xueyuan_4_dict], [x[1] for x in xueyuan_4_dict])
    14. pl.xticks(rotation=90, fontsize=14)
    15. plt.title('各学院四级通过率分布柱状图', fontdict={'weight':'normal','size': 20})
    16. plt.show()

     

    4. 总结

            全球化时代,英语的重要性日益凸显。现如今我国高校英语教育还存在教学形式单一、没有创新、传统模式已经不适合当今社会发展等弊端,需要制订出符合国情的教学规划,采取相对应的策略,增进教育理念,培养高素质人才。本项目利用 pandas + Matplotlib + seaborn + sklearn 等工具包对某高校各大学院学生历年的四六级数据进行多维度的统计分析,展现高校英语的现状,为英语教学改革提供精细化的分析。

     》源代码下载:基于大数据的高校英语现状分析【毕业设计】【Python】【网络爬虫】【数据分析】【数据集+源代码+视频】-CSDN下载

    欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。

    技术交流认准下方 CSDN 官方提供的学长 QQ 名片 :)

    精彩专栏推荐订阅:

    Python 毕设精品实战案例

  • 相关阅读:
    手搓一个ubuntu自动安装python3.9的sh脚本
    Maven 的 spring-boot-maven-plugin 红色报错
    如何保证云docker容器重启后数据不丢失
    微博超话签到Js脚本
    11.7加减计数器,可置位~,数字钟分秒,串转并,串累加转并,24位串并128,流水乘法器,一些乘法器
    基于Django的博客系统之增加类别导航栏(六)
    钟汉良日记:改变心态了,回武平待3年
    Python 自动化教程(5) : 自动生成Word文件
    python实现对遥感影像经纬度获取并实现海陆分离
    TTL反相器和CMOS
  • 原文地址:https://blog.csdn.net/andrew_extra/article/details/125549601