spaCy 是一个用于 Python 中高级自然语言处理的开源库。它专为生产用途而设计,这意味着它不仅功能强大,而且快速高效。spaCy 在学术界和工业界广泛用于各种 NLP 任务,例如标记化、词性标注、命名实体识别等。
安装,这里使用阿里的源。
- pip install spacy -i https://mirrors.aliyun.com/pypi/simple/
- pip install spacy_pkuseg -i https://mirrors.aliyun.com/pypi/simple/
下载预训练的语言模型,spaCy支持七十多种语言。
python -m spacy download zh_core_web_sm
这里下载未必很顺利,可以考虑直接到页面下载。