📝 OpenNLP教程

13篇技术文档
  OpenNLP教程

📅  最后修改于: 2020-11-23 03:51:39        🧑  作者: Mango

ApacheOpenNLP是一个开放源代码Java库,用于处理自然语言文本。 OpenNLP提供的服务包括令牌化,句子分段,词性标记,命名实体提取,分块,解析和共引用解析等。在本教程中,我们将了解如何使用OpenNLP库来构建高效的文字处理服务。本教程已为初学者准备,使他们了解如何使用OpenNLP库,从而帮助他们使用此库构建文本处理服务。先决条件对于本教程,假定读者具有Java编程语言的先验知识...

  OpenNLP-概述

📅  最后修改于: 2020-11-23 03:52:04        🧑  作者: Mango

NLP是用于从自然语言源(例如网页和文本文档)中获取有意义和有用信息的一组工具。什么是开放NLP?ApacheOpenNLP是一个开源Java库,用于处理自然语言文本。您可以使用此库构建高效的文本处理服务。OpenNLP提供的服务包括令牌化,句子分段,词性标记,命名实体提取,分块,解析和共引用解析等。OpenNLP的功能以下是OpenNLP的显着功能-命名实体识别(NER)-Open NLP支持N...

  OpenNLP-环境

📅  最后修改于: 2020-11-23 03:52:37        🧑  作者: Mango

在本章中,我们将讨论如何在系统中设置OpenNLP环境。让我们从安装过程开始。安装OpenNLP以下是在系统中下载Apache OpenNLP库的步骤。第1步-打开的Apache OpenNLP的点击以下链接主页-https://opennlp.apache.org/。步骤2-现在,单击下载链接。单击后,将转到一个页面,您可以在其中找到各种镜像,这些镜像会将您重定向到Apache Software...

  OpenNLP-引用的API

📅  最后修改于: 2020-11-23 03:53:11        🧑  作者: Mango

在本章中,我们将讨论本教程后续各章中将使用的类和方法。句子检测SentenceModel类此类表示预定义的模型,该模型用于检测给定原始文本中的句子。此类属于包opennlp.tools.sentdetect。此类的构造函数接受句子检测器模型文件(en-sent.bin)的InputStream对象。SentenceDetectorME类此类属于包opennlp.tools.sentdetect,它...

  OpenNLP-句子检测

📅  最后修改于: 2020-11-23 03:54:09        🧑  作者: Mango

在处理自然语言时,确定句子的开头和结尾是要解决的问题之一。这个过程被称为为Sentence乙oundarydisambiguation(SBD)或简单句子断裂。我们用来检测给定文本中句子的技术取决于文本的语言。使用Java进行句子检测我们可以使用正则表达式和一组简单规则来检测Java中给定文本中的句子。例如,让我们假设一个句点,一个问号或一个感叹号在给定文本中结束一个句子,然后我们可以使用Stri...

  OpenNLP-令牌化

📅  最后修改于: 2020-11-23 03:55:28        🧑  作者: Mango

将给定的句子切成较小的部分(令牌)的过程称为标记化。通常,给定的原始文本是基于一组定界符(主要是空白)来标记的。令牌化用于诸如拼写检查,处理搜索,识别语音部分,句子检测,文档的文档分类等任务中。使用OpenNLP标记opennlp.tools.tokenize软件包包含用于执行标记化的类和接口。为了将给定的句子标记为更简单的片段,OpenNLP库提供了三种不同的类-SimpleTokenizer-...

  OpenNLP-命名实体识别

📅  最后修改于: 2020-11-23 03:56:17        🧑  作者: Mango

如NAMEDêntity[Recognition(NER)找到名字,人物,地点和其他实体,从给定文本的过程是已知的。在本章中,我们将讨论如何使用OpenNLP库通过Java程序执行NER。使用开放NLP的命名实体识别为了执行各种NER任务,OpenNLP使用不同的预定义模型,即en-nerdate.bn,en-ner-location.bin,en-ner-organization.bin,en-...

  OpenNLP-查找词性

📅  最后修改于: 2020-11-23 03:57:03        🧑  作者: Mango

使用OpenNLP,您还可以检测给定句子的词性并将其打印出来。 OpenNLP而不是词性的全称,而是使用词性的简短形式。下表列出了OpenNLP检测到的语音的各个部分及其含义。Parts of SpeechMeaning of parts of speechNNNoun, singular or massDTDeterminerVBVerb, base formVBDVerb, past tens...

  OpenNLP-解析句子

📅  最后修改于: 2020-11-23 03:57:28        🧑  作者: Mango

使用OpenNLP API,您可以解析给定的句子。在本章中,我们将讨论如何使用OpenNLP API解析原始文本。使用OpenNLP库解析原始文本为了检测句子,OpenNLP使用预定义的模型,名为en-parserchunking.bin的文件。这是一个预定义的模型,经过训练可以解析给定的原始文本。opennlp.tools.Parser包的Parser类用于保存解析成分,而opennlp.too...

  OpenNLP-分句

📅  最后修改于: 2020-11-23 03:58:10        🧑  作者: Mango

将句子分块是指将句子分为单词部分(例如单词组和动词组)。使用OpenNLP分割句子为了检测句子,OpenNLP使用一个名为en-chunker.bin的模型。这是一个预定义的模型,经过训练可以对给定原始文本中的句子进行分块。opennlp.tools.chunker程序包包含用于查找非递归语法注释(例如名词短语块)的类和接口。您可以使用ChunkerME类的方法chunk()对句子进行分块。此方法...

  OpenNLP-命令行界面

📅  最后修改于: 2020-11-23 03:58:31        🧑  作者: Mango

OpenNLP提供了命令行界面(CLI),可通过命令行执行不同的操作。在本章中,我们将通过一些示例来说明如何使用OpenNLP命令行界面。代币化input.txt句法命令输出output.txt句子检测input.txt句法命令输出Output_sendet.txt命名实体识别input.txt句法命令输出语音标记部分Input.txt句法命令输出...

  OpenNLP-有用的资源

📅  最后修改于: 2020-11-23 03:58:45        🧑  作者: Mango

以下资源包含有关OpenNLP的其他信息。请使用它们来获得有关此方面的更深入的知识。OpenNLP上的有用链接OpenNLP Wiki–OpenNLP的维基百科参考。有关OpenNLP的有用书籍要在此页面上注册您的网站,请发送电子邮件至...

  讨论OpenNLP

📅  最后修改于: 2020-11-23 03:58:57        🧑  作者: Mango

ApacheOpenNLP是一个开放源代码Java库,用于处理自然语言文本。 OpenNLP提供的服务包括令牌化,句子分段,词性标记,命名实体提取,分块,解析和共引用解析等。在本教程中,我们将了解如何使用OpenNLP库来构建高效的文字处理服务。...