使用grabit分析mysql数据库中的数据血缘关系
Grabit 是一个辅助工具,用于从数据库、GitHub 等修订系统、bitbucket 和文件系统等各种来源收集 SQL 脚本和存储过程,然后将其推送到 SQLFlow 服务器进行分析并生成元数据和数据沿袭。
1、Grabit 的主要用途
连接到数据库
从Oracle、SQL Server等数据库中提取创建表、创建视图和存储过程等SQL查询,并发送到SQLFlow进行分析。
连接到SQLFlow系统
从 Github、Bitbucket 等修订系统中获取 SQL 文件并发送到 SQLFlow 以获取数据沿袭。
搜索文件系统
在本地文件系统中找到 SQL 文件并推送它 SQLFlow 以可视化数据沿袭。
本文介绍如何使用grabit分析mysql数据库中的数据血缘关系。
2、如何配置grabit环境
运行grabit的环境需要配置Java 8及以上版本,并需要在系统变量中配置如下信息,部署时请主要java的更换安装路径:
export JAVA_HOME=/usr/lib/jvm/default-java
export PATH=$JAVA_HOME/bin:$PATH
运行grabit
以windows环境下为例,需要执行grbit安装目录下执行start.bat
3、如何连接到数据库
在grabit启动页面有Database、Github、Bitbucket、Single File等多种数据源提供方式,本文重点介绍使用database方式进行获取数据源,想了解其他方式,请参考https://github.com/sqlparser/sqlflow_public/tree/master/grabit。
选择mysql数据库类型,然后点击next
点击next后来到数据库配置信息页面,其中前四项为必填项,后面的为选填项。关于选填项中各项具体信息请参阅https://github.com/sqlparser/sqlflow_public/tree/master/grabit获取更详细的介绍。
配置完上述信息后,点击【upload】即可上传至sqlflow服务器并生成相应的job,如下图
如您使用的是sqlflow的云版本,需要注册一个高级会员。
可以点击【save config】保存当前的配置文件,随后点击close关闭grabit。
4、使用sqlflow获取数据血缘关系分析结果
到sqlflow服务器上查看,您可以看到相应的job已经建立并能轻松获取自动分析的数据血缘关系,如下图:
至此,使用grabit分析mysql数据库中的血缘关系介绍完毕。
参考
马哈鱼数据血缘分析器:
马哈鱼数据血缘分析器中文网站: