简单应用复旦FNLP自然语言处理工具(一)

摘要:
中国自然语言处理工具包(正式名称为复旦NLP)首次下载最新的fnlp版本文件。)IE浏览器可能无法移动。有一个教程链接。有两个教程。我认为第二篇教程中唯一有用的部分是一篇关于Eclipse安装Maven插件的文章。Eclipse在使用fnlp工具之前安装Maven插件。

FNLP是一个基于机器学习的中文自然语言文本处理的开发工具包,FNLP主要是为中文自然语言处理而开发的工具包,也包含为实现这些任务的机器学习算法和数据集。

                                                     ----------百度百科

  • 信息检索 文本分类 新闻聚类
  • 中文处理: 中文分词 词性标注 实体名识别 关键词抽取 依存句法分析 时间短语识别
  • 结构化学习: 在线学习 层次分类 聚类

在看这篇文章之前,请确定已经装好了Eclipse,如果没有安装Eclipse,请看这里JSP环境安装

因为FNLP在Github上已经有了很详尽的入门教程,所以在这里我只是把这些教程的顺序、要点和要注意的地方写出来:

FNLP在Github上的项目地址:中文自然语言处理工具包 Toolkit for Chinese natural language processing (formerly FudanNLP)

首先先下载最新的fnlp版本文件,点这里............................:)IE浏览器有可能会点不动

简单应用复旦FNLP自然语言处理工具(一)第1张

往下找有一个入门教程链接

简单应用复旦FNLP自然语言处理工具(一)第2张

入门教程有两个,我感觉第二个教程唯一有用的是一篇介绍Eclipse安装Maven插件的文章,在这里:Eclipse安装Maven插件

在使用fnlp工具之前,我们需要先安装Maven工具,Maven和maven插件我已经传到了网盘里,这里是地址Maven网盘文件

现在简单的测试一下你的环境配置有没有成功,打开cmd,分别输入java -version     javac -version     mvn -version

简单应用复旦FNLP自然语言处理工具(一)第3张 


简单应用复旦FNLP自然语言处理工具(一)第4张


简单应用复旦FNLP自然语言处理工具(一)第5张

进行到这一步可能有的同学会出现问题,提示没有JAVA_HOME变量,进入电脑系统属性-环境变量,新建系统变量JAVA_HOME,变量值为java/jdk的安装目录,java安装目录在cmd下可以用java -verbose查看

简单应用复旦FNLP自然语言处理工具(一)第6张

最后一行的地址就是你的java安装地址,以我的电脑为例,JAVA_HOME的变量名就是C:Program FilesJavajdk1.8.0_20



好了,现在环境已经配置好了,其实有一些步骤我也是借鉴的第一篇教程,现在开始看第一篇fnlp入门教程:


为了方便,官方给的模型文件、两个jar包的链接在这里直接贴出来http://pan.baidu.com/s/1D7CVc ,注意jar包只需要下载Trove和Commons-cli两个。

接下来按教程走 

简单应用复旦FNLP自然语言处理工具(一)第7张 

cmd进入fnlp源码目录,如我的fnlp文件放在E:/fnlp下,

简单应用复旦FNLP自然语言处理工具(一)第8张

执行上面的命令:mvn install -Dmaven.test.skip=true,编译fnlp

接下来就简单多了,不过要注意官方教程里命令行调用中,包与包的间隔用的  :  号,windows用户要改成  ;  号,英文状态下。

在Eclipse项目中引用FNLP中需要注意的是,新建一个java Project,如果没有找到,请注意右上角

简单应用复旦FNLP自然语言处理工具(一)第9张

然后只要按照Github上的第一个教程就好了


其实好多都是官方已经说明的,嗯,先感谢一下FNLP项目组成员!!!下面介绍几个常见错误解决办法(百度来的,经过验证)


一、命令行执行报错模型文件版本错误


  用网盘的模型文件就好了,这种错误是因为你的模型文件和FNLP版本号不符,网盘里永远是最新的


二、命令行报错找不到或无法加载主类


  首先请确定你的系统变量配置正确,Path,CLASSPATH还有JAVA_HOME

  系统变量的正确配置是类似

简单应用复旦FNLP自然语言处理工具(一)第10张

   只要把JAVA_HOME换成你的jdk目录就好了


三、如果报错空指针异常之类的错误,怎么也检查不到代码错误,或者干脆是cmd执行却还是报空指针异常

  额,恭喜你,估计是源文件有问题,欢迎加群253541693,报告管理员。 

四、无论是maven,fnlp或者jdk,安装目录都不要用中文,否则奇奇怪怪的问题就来了。虽然,我的是英文路径。


因为本人也是刚刚认识的FNLP,在安装使用的过程中遇到了问题,也走了弯路,所以特地将安装使用过程详细的整理了下,希望能给想要使用FNLP的同学以帮助!

最后,欢迎有问题有错误的同学到这里一起讨论,共同进步。转载请注明来自任祥磊。 

免责声明:文章转载自《简单应用复旦FNLP自然语言处理工具(一)》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇关于移动端输入键盘遮挡页面elementui源码解析markdown处理下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

python下编译py成pyc和pyo

其实很简单,用python -m py_compile file.py python -m py_compile /root/src/{file1,file2}.py编译成pyc文件。也可以写份脚本来做这事:Code: import py_compile py_compile.compile('path') //path是包括.py文件名的路径 用py...

工具-效率工具-XMIND8破解(99.1.3)

@ 目录 1.下载 2.修改hosts文件 3.修改配置文件 4.填入序列号 5.破解完成 关于作者 1.下载 1.点击进入官方网站下载 2.下载破解包 网址:点击进入网盘地址 密码:domd 2.修改hosts文件 1.进入C:WindowsSystem32driversetc目录使用文本工具打开HOSTS文件 2.添加以下代码 0.0.0.0...

PHP 原生实现MVC框架

2017-6-5 由于工作需要 打算自己实现一个简单的  MVC框架以完成工作需求   初步定义 框架需要完成的工作 1.单入口的路由功能 2.文件的自动载入 3.流水ID的加密以及自动解密 4.MVC文件夹模式 5.通用模板的引用     单入口的路由实现   项目接口的 public 目录中存在一个index.php 文件 作为 项目的唯一入口   文...

MySQL的binlog数据如何查看

binlog介绍 binlog,即二进制日志,它记录了数据库上的所有改变. 改变数据库的SQL语句执行结束时,将在binlog的末尾写入一条记录,同时通知语句解析器,语句执行完毕. binlog格式 基于语句,无法保证所有语句都在从库执行成功,比如update ... limit 1; 基于行,将每一次改动记为binlog中的一行.在执行一个特别复杂的...

Linux下输出 excel文件

Linux下输出 excel文件 今日提供给产品需求,需excel文件,故总结要点如下:  1.默认间隔是space_20 2.修改为TAB   _09 awk '  BEGIN { OFS=" "} ;{ $1=$1 ; print $0} ' aa.txt>aa.xls   Ps :        1.查看工具 od -x -c    ue  ...

使用iText库创建PDF文件

前言 译文连接:http://howtodoinjava.com/apache-commons/create-pdf-files-in-java-itext-tutorial/ 对于excel文件的读写操作,相信大家都比较熟悉,使用apache的POI库即可。本篇文章,我将基于iText库编写各式各样的代码示例去创建PDF文件。这些例子会按它们各自的功能分...