信贷风控正从传统的人工时代转型进入数字风控。很多同学因为各种原因追随这个行业的步伐不够快,导致没来得及跟上行业和风向的变化,不少从业者都陷入了困境之中。自我们的平台创办以来,后台收到小伙伴询问的top话题之一也是职业发展的问题。
之前星球里星主陈老师,也提到了一些关于风控数据分析师职业发展跟学习路径的过程,可以参考这篇文章《看看那些大佬是怎么走上量化风控道路的?》
详情可到星球中查看相关帖子:
当然关于风控数据分析师的学习路径,随着不同时期的发展,其需要了解及掌握的工具都不太一样,本次我们整理了一个更丰富的内容共大家了解。本次我们介绍一个工具篇内容,数据分析分析师需要掌握的四个基本工具:Excel、Hive、可视化平台、Python。
①Excel—必须掌握
必备要求:⭐⭐⭐⭐⭐
Excel无论是作为策略分析师还是模型师都必须掌握的一门技术。
基础功能:表格汇报、数据计算
高阶功能:VBA、时间序列分析
②Hive(sql)—必须掌握
必备要求:⭐⭐⭐⭐
几乎99%的互联网金融公司。都是基于Hive或者Mysql进行数据提取
基础语法:查询、建表、关联
中高级:窗口函数、自己写function
③可视化平台—展示数据的方式、中期掌握
必备要求:⭐⭐⭐⭐
传统:Excel、PPT
新型BI工具:Tableau、观远
④Python—后期可以掌握
必备要求:⭐⭐⭐⭐
数据清洗、模型使用
以上的四个工具类型中,①②④我们都曾经开播过相关的课程供大家学习了解的。本次我们讲解其中的第③个工具可视化平台工具。在可视化平台工具中,以Tableau目前为最常提及的分析工具。
【其中涉及以上①②④的工具内容有:
①第82期课程《风控策略中的模型须知-逻辑回归评分卡分箱与模型评估》
②《风控数据分析训练营》
④第85/86期课程《模型开发之特征选择》等】
Tableau:Tableau当前无论在互联网还是互联网金融公司,均是使用率较高的一个BI可视化软件。Tableau无论是电子表格、数据库还是Hadoop 和云服务,任何数据都可以轻松探索,以此来展示可视化数据。使用非常便利。
今天,我们会再详细讲解Tableau与风控数据分析的结合场景。在风控场景中,比如用到最多的其中一个场景,就是贷中场景风控中对商户监控使用的生命周期柱状图与经营煤层图的监控。
(以下内容在上周的文章中已经跟大家进行了详细讲解:《场景风控下贷中客户生命周期的监控》)
①生命周期柱状图监控
比如在实际的监控场景中,我们会分析每个月中商户的放款数据。以2020年3月2020年8月的数据为例。在下图中可以看到,在数据分布中,蓝色方块的商户A在3月8月,这5个月份中的放款量都十分稳定;而橙色方块的商户B,在同样的时间区间3月~8月中,每个月的放款量是在逐步缩减(方块面积越来越小)。
证明商户A整体业务量较商户B稳定,从这个维度,我们可以进一步分析,商户A与商户B的通过率等情况,比如商户B是否因为前端的拒绝率增加,而导致的业务量增高等。
②.经营煤层图
除了柱状图,另一个我们常用到的可视化分析工具就是:煤层图。
煤层图,从名字可以看出就像地质上的煤层一样。物质是一层一层往上堆积,每一层之间不交叉不相融(记住就是没有包含关系,这个概念非常重要,影响后续的数据分析思考)
还是以上面的数据为例,我们画出了以下的相关煤层图:
还是举例以蓝色方块的商户A和橙色方块的商户B为例,供大家理解。我们比较的是在同个时间放款区域中的面积,就能对比出具体的商户放款量数据了。在分析中,我们分别截取4月5月,7月8月这两个时间截面,也就是下图中标示的两块煤层图的面积:
当然在相关的可视化的监测指标中,除了以上内容,还有高频使用的直方图、线型图、热图、气泡图、地图、散点图、盒须图等相关内容:
…
~原创文章