进入hudi官网:
https://hudi.apache.org/releases/download
下载安装包:
我这里下载最新版0.11.1
如下图,这里上传到/usr/local/hudi目录下,并解压到该目录下
我这边服务器安装的是cdh5.16.2,hadoop版本是2.6.0的,scala版本是2.11.8。
如下图:
编译:
cd /usr/local/hudi/hudi-0.11.1
mvn clean install -DskipTests -Drat.skip=true -Dscala-2.11
如果你的服务器已经安装有maven,那么就应该在编译了,可以跳过maven安装过程。
注意:maven版本最好在3.8以上。
我这个服务器没有安装maven,说没有mvn命令,所以需要安装一下:
==============================================================================
安装maven
下载最新的3.8.6版本
上传服务器后,解压命令如下:
tar -zxvf apache-maven-3.8.6-bin.tar.gz
可以修改conf/settings.xml,资源设置成阿里镜像:
<mirror>
<id>alimaven</id>
<name>aliyun maven</name>
<url>http://maven.aliyun.com/nexus/content/groups/public/</url>
<mirrorOf>central</mirrorOf>
</mirror>
<mirror>
<id>alimaven</id>
<mirrorOf>central</mirrorOf>
<name>aliyun maven</name>
<url>http://maven.aliyun.com/nexus/content/repositories/central/</url>
</mirror>
配置maven:
vim /etc/profile
把maven路径添加进来,写自己的maven路径:
export MAVEN_HOME=/usr/local/apache-maven-3.8.6
export PATH=$MAVEN_HOME/bin:$PATH
最后应用一下:
source /etc/profile
maven安装完成:
============================================================================
在次运行编译命令:
cd /usr/local/hudi/hudi-0.11.1
mvn clean install -DskipTests -Drat.skip=true -Dscala-2.11
如下图,开始正常编译了:
遇到的问题
原因:设置的hadoop版本不匹配,我之前设置的hadoop是2.6.0,因为hudi编译版本要是在2.7+
解决:把命令后面设置hadoop版本的给去掉,或者设置为高版本的。