今天在视频号平台看到有小姐姐直播讲爬虫技术,我一看这不是挺简单的吗?于是我就想到自己四年前的今天刚进大一的时候最开始学的爬虫技术,后来因为一些事情跑去打比赛,现在又是在跨考的路上不务正业,hhhh。
然后导入 PyQuery
模块的时候出问题,报错信息如下:
最后百度了一下问题,原因是 Pip
版本的问题,于是根据按照网上的教程作了一个整理。
首先找到 Python
目录下的 Script
输入命令 pip list
查看 pip
的版本号。
这个时候不要被这个建议误导,正确操作如下 👇
在电脑地址栏当中输入 %APPDATA%
,输入正确的指令后按下回车即 enter
键进入到对应的文件夹,如 👇 所示
在刚才进入的文件下新建一个记事本,然后把文件名修改成 pip.ini
,在里面输入如👇代码
[global]
index-url=https://pypi.tuna.tsinghua.edu.cn/simple/
[install]
trusted-host=pypi.tuna.tsinghua.edu.cn
然后点击保存,下面解释一下这段代码的含义。
在使用 Python
时会进行安装大量的模块,pip
是我们使用的安装包管理工具,输入命令 pip install 包名
就能安装,但是由于某些包官网处在国外,安装时很慢很慢,还会断线timeout
,所以有一个解决办法就是将 pip
的源换成国内的 pip
仓库,经常使用的比较可靠的有阿里、腾讯、清华、豆瓣等。
清华 pip
源 :https://pypi.tuna.tsinghua.edu.cn/simple
豆瓣 pip
源:http://pypi.douban.com/simple/
阿里 pip
源: https://mirrors.aliyun.com/pypi/simple/
腾讯 pip
源: http://mirrors.cloud.tencent.com/pypi/simple
如果只想命令修改,那么就在每次安装的时候加上参数 -I pip
源地址即可。如👇
pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
不想每次都加参数,直接替换怎么替换呢,就直接设置全局使用,比如是用清华:
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
如果想恢复请输入 pip config unset global.index-url
即可。还有一种方式就在 windows
的 user
目录下创建一个pip
目录,例如:C:/Users/cillian/pip
,然后新建一个 pip.ini
,内容就是如下这样的即可。
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
输入如👇命令
python -m pip install pip==20.2.4
当显示 Successfully installed pip-20.2.4
时,这个时候安装成功啦,然后再输入 pip list
查看一下。
大功告成,然后就是安装 pyquery
包。
打开 File
⇒ settings
,如 👇 所示
搜索需要安装的包,然后安装下面这个操作去做如 👇 所示即安装成功。
检测是否在 pycharm
安装成功:安装完成后可以在 pycharm
检测一下,输入 import pygame
运行,没报错说明安装成功。
可以玩一下大一玩的爬虫,技术并非无罪,千万别突破红线(逃…)
今天遇到的问题整理一下,如果能帮助到正在学习 Python
的小伙伴请三连支持一下趴,哈哈哈,完美结束恰饭。