作为统计专业的学生需要学习哪些基础课程呢?
1、数学分析 2、高等代数
我在这边推荐两位老师的课程,1、复旦 陈纪修老师的数学分析课程 2、北大 邱维声老师的高等代数课程。
学完这两门课程后就可以学习概率论与数理统计课程了,推荐茆诗松老师的概率论与数理统计教材。
这三门基础课掌握的扎实程度决定了后期的专业课学习的效果。
统计专业的专业课主要有回归分析,多元统计分析,时间序列分析等。
时间序列分析的教材推荐使用蔡瑞胸老师的金融时间序列分析,
蔡老师是芝加哥大学时间序列分析国际顶级专家,在国际顶级杂志发表多篇文章。
1、回归分析
关于回归分析,在了解正则方程组求解回归系数的基础上,还可以学习一下梯度下降算法——另一种求解系数的方法,正规方程组虽然能够一步求出回归系数的估计,但是当数据量及数据特征较多时,矩阵求逆计算量很大,而梯度下降法是迭代算法,运算速度较快,其扩展随机梯度下降算法能够处理数百万级别的数据量。
2、多元统计分析
关于多元统计分析,重点了解 LDA 线性判别分析和主成分分析PCA的讲解,LDA 的推导及主成分分析的思想在各互联网公司面试十分常见。
3、时间序列分析
关于时间序列分析,对于想要从事金融行业的同学来说 ARCH 和 GARCH 模型要深刻理解和掌握(其本质仍然是ARMA模型的思想),从个人的学习经历来说,时间序列分析包括两大类,一类是计量经济领域的模型例如向量自回归, ARCH 和 GARCH 模型等,另一类是深度学习方向的循环神经网络 RNN 和 长短期记忆网络 LSTM。
1、李航统计学习方法
这本书理论推导较为详细,希望同学们能够耐下心来努力推导,由于个人基础原因,本人断断续续推导 4 个月才将全书推完,这本书实在太难啃了,需要对概率统计及微积分,十分熟悉。本书是想进BAT华为等互联网公司数据挖掘岗位或者算法工程师工作同学的必读书目。
2、周志华的机器学习西瓜书
南京大学周志华教授,可能是为数不多的没有出国留学经验的机器学习顶级大师,周志华的机器学习书在大厂的算法,数据挖掘部门可以说是人手一本。说实话这本书可能不适合初学者,推导过程十分不详细,但是这本书比较全面,几乎覆盖了机器学习的方方面面。可结合南瓜书进行阅读(南瓜书是对西瓜书中的公式进行详细推导的一本开源书目)
3、The element of statistical learning
这本书主要适用于频率学派的统计学者阅读,网上可搜到pdf版本。这本书是斯坦福大学几个统计大牛写的。个人觉得如果你能啃完这本书、熟练理解掌握书中内容并且依然对统计学习有浓厚兴趣,建议去读个博士做做研究。个人偏向将这本书当作参考书,查阅资料使用。
1、EXCEL
一般小企业实习的时候用的都是 excel,数据透视表,vlookup,countif ,sumif 这些函数一定要熟练使用,大学有时间考个计算机二级,哪怕考不出证书,excel 也要掌握点东西,否则公司可能会说统计专业的连 excel 都用不来。
2、SQL语言
SQL 又称结构化查询语言,对于做数据分析的人来说,不会SQL就连数据都获取不了,网易公司数据分析的笔试考的就是SQL取数,可见其重要性。
3、tableau
商业数据分析可视化神器,个人了解不多,但是招聘网站上都说要求,数据可视化可能用这个又方便又好看
4、R 和 python
有人问我R 和 python 选哪个学,我思考了挺久的,这两门语言我都学过,个人认为如果你像搞研究就去学 R,如果想工作就去学python。R语言适合统计专业的使用,因为它就是统计学家发明的语言,但是从编程的角度来说,确实不是特别规范,而且运行速度可能不是很快。python 可以做网页爬虫,可以做网页开发,可以做数据分析,机器学习和深度学习等,是一门比较好的程序语言。