EasyRec是阿里巴巴开源的推荐系统框架。生命苦短,从建好的推荐系统框架开始学,可以更高效的学习与入门推荐系统,也有利于对推荐系统有个整体的认知。
学习推荐系统还是建议使用Ubuntu之类的Linux系统,相比Windows系统更容易进行配置与调用,使用Windows并不方便。
首先需要在Ubuntu系统上安装好tensorflow,可以参考该博客配置tensorflow-gpu==2.4的环境。
https://blog.csdn.net/weixin_44791964/article/details/126089511
然后在此环境下进行EasyRec包的配置。
https://github.com/alibaba/EasyRec
此处使用的是SSH来进行配置,终端即可操作,因为不需要使用到环境界面,实际配置时,可视界面上的终端是一样的。
按照步骤执行,会将EasyRec安装到python环境中。
这里推荐使用git来进行EasyRec的下载,我们首先创建一个空文件夹,将终端显示的目录调整到这里。
然后使用git指令下载EasyRec。
git clone https://github.com/alibaba/EasyRec.git
整个文件夹有几十M在,需要我们耐心等候。下载完成后可以看到文件夹。
首先利用cd指令进入EasyRec文件夹,如图所示:
由于我们需要在TF的环境里面使用EasyRec,所以我们需要激活对应的TF环境。
然后建议大家先将EasyRec/requirements/runtime.txt里的tensorflow删掉,否则会有些电脑会自动安装最新版本的tensorflow,但事实上不需要最新的tensorflow,可能会破坏原有的环境。
删除方式如下,通过vim指令打开requirements/runtime.txt:
vim requirements/runtime.txt
给tensorflow前端加上#后,按Esc,之后利用:wq退出vim。
之后在终端中输入下列指令进行初始化。
bash scripts/init.sh
初始化需要一定的时间,在这其中需要下载一些文件。
在完成init之后,我们可以通过setup.py进行EasyRec的安装。
具体安装方式如下,根目录依然是在EasyRec的根目录下。
之后在终端中输入下列指令进行安装。
python setup.py install
安装完毕后,终端会提示安装成功。
此时可以进入python环境,正确的导入easy_rec。
在EasyRec库中,如果需要使用负采样的话,要用到graph-learn。但graph-learn在requirements里面却没有。
如果想要支持graph-learn,需要安装numpy==1.20以上,此时pip会提示numpy版本和tensorflow不兼容,但其实不影响代码的正常执行。可通过如下方式进行安装。
pip install graph-learn
pip install numpy==1.20