目前需要的NLP岗位要求中常见字眼“信息抽取,关系抽取”,不懂的就会问,这是啥?莫不是token 分类,NER?其实不是,应该是类似于属性信息,比如商品,价格25,销量1w+,加购2000+,产地北京,等等一些商品的描述信息,也可以是人的属性信息,比如我,年龄25,身高183,体重73,身价1kw,家乡北京,等等。当然也可以是人与人之间的信息,比如娱乐圈,谁的谁是谁的前任,谁的女儿是谁的孩子,他爹是谁,他后爹是谁,他干爹是谁,等等。也可以是结构化信息。
下面以飞酱的开源UIE(Universal Information Extraction)为例进行实际操作,
安装飞酱是基础,否则paddlenlp也不能用。
- $ pip install --upgrade paddlenlp
- $ python -m pip install paddlepaddle==2.3.