小白NLP入门,pyhanlp安装以及初步调试

NLP学习入门

  • pyhanlp的安装
  • hanlp安装
  • 命令行测试
  • 在pycharm中测试

pyhanlp的安装

在命令行中输入指令:

pip install pyhanlp

成功后可直接开始调试。

如果windows报错,多半需要安装Visual C++或者更轻量的Miniconda,报错时会同时提供下载地址,下载并安装。
输入指令:

conda install -c conda -forge jpype1
pip install pyhanlp

问题得解。

hanlp安装

命令行输入指令:

hanlp

坐等下载安装即可,下面是我安装完成后的信息:

usage: hanlp [-h] [-v] {segment,parse,serve,update} ...

HanLP: Han Language Processing v1.7.8

positional arguments:
  {segment,parse,serve,update}
                        which task to perform?
    segment             word segmentation
    parse               dependency parsing
    serve               start http server
    update              update jar and data of HanLP

optional arguments:
  -h, --help            show this help message and exit
  -v, --version         show installed versions of HanLP

命令行测试

输入指令:

hanlp segment

这是分词功能,接下来你只需要输入一段你想测试的语句即可

'接下来我给大家打一个五连鞭'

得到结果:

'/nx 接下来/vl 我/rr 给/p 大家/rr 打/v 一个/mq 五连/nz 鞭/ng '/nx

在pycharm中测试

输入代码:

from pyhanlp import *

初次运行会显示错误,在pyhanlp下按下A/T+Enter下载***data.zip***并等待其解压完成。
接下来是测试代码:

from pyhanlp import *

# 新闻摘自中国新闻网
document = "11月3日电 据中央气象台网站消息,受冷空气和“天鹅”的共同影响"\
		   "3日08时至4日08时,东海南部、台湾海峡、台湾以东洋面、巴士海峡、北部湾、南海大部、中沙群岛、"\
           "西沙群岛以及浙江沿海、福建沿海、广东沿海、海南岛东部沿海将有6-7级大风。"\
           "未来三天,受高原槽影响,青藏高原东部有雨雪天气,其中青海东南部和川西高原北部部分地区有中到大雪。"\
           "云南、西藏东南部等地有小到中雨,局地大雨。"

# 提取document的两个关键词
print(HanLP.extractKeyword(document, 2))

# 提取ducument中的3个关键句作为摘要
print(HanLP.extractSummary(document, 3))

得到结果:

[影响, 高原]
[受高原槽影响, 其中青海东南部和川西高原北部部分地区有中到大雪, 青藏高原东部有雨雪天气]

大家可以看到,得到的结果并不是很精准。对不同的语句进行分析会得到不同的结果,其精准度也有不同。

你可能感兴趣的:(NLP自然语言处理,人工智能,nlp,自然语言处理)