StanfordNER模型使⽤,训练⾃⼰的NER模型,终端使⽤和
java调⽤
使⽤Stanford NER模型对语料进⾏命名实体识别
⾸先下载Stanford NER包,地址nlp.stanford.edu/software/CRF-NER.html,然后下载解压即可使⽤。
⼀、⽤Stanford NER原始训练好的模型对语料识别
1.简单默认操作:
命令:
java -mx600m -cp "*;lib\*" edu.stanford.f.CRFClassifier -loadClassifier classifiers/english.all. -
上⾯参数详解
-cp  表⽰依赖包路径(直接指定jar包也⾏,如将"*;lib\*"替换为stanford-ner.jar);
classifiers/english.all.  指选择的命名实体识别模型;
< 要识别语料的⽂件。
2.可选参数,能选择数据输出格式,和输出到⽂件
命令:
java -mx600m -cp "*;lib/*" edu.stanford.f.CRFClassifier -loadClassifier classifiers/english.all. -outputFormat tabbedEntities -
java调用python模型-outputFormat tabbedEntities 指数据输出格式为tabbedEntities,如果不加这个参数,默认为在词的两
边进⾏实体标注
> sample.tsv 表⽰输出结果到⽂件sample.tsv
⼆、启⽤Stanford NER本地服务器处理NER
1.开启服务器命令:
java -mx1000m -cp stanford-ner.jar edu.stanford.nlp.ie.NERServer  -loadClassifier ll.  -port 2314 -outputForm
2.然后打开另⼀个终端,输⼊NER识别命令:
java -cp stanford-ner.jar edu.stanford.nlp.ie.NERServer -port 2314 -client
3.接着在该终端中输⼊你要操作NER的语⾔,按回车键后就能看到识别结果
三、训练⾃⼰的模型:如果没有把Stanford NER配置到系统环境变量,以下操作需要在该⽂件下
1.⾸先建⽴⾃⼰的标注语料,句⼦中的每个单词独⽴成⾏,Tab后跟该单词的标注类别,默认为O,例:将Friday(星期)标注为week
2.训练标注语料产⽣模型:官⽅说虽然所有的参数都可以通过命令⾏的⽅式指定,但更推荐⽤配置⽂件的⽅式。        配置⽂件(⽂件内容较多这⾥为给出),然后命名格式xxx.prop
3.执⾏命令:
java -cp stanford-ner.jar edu.stanford.f.CRFClassifier -prop xxx.prop
然后会在该⽬录下看到⼀个的模型⽂件
4.⽤⾃⼰的模型识别实体同上⼀或⼆,本识别结果如下:
四、java调⽤
参考本项⽬地址:
四、Python接⼝使⽤
参考博客链接:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。