📜  OpenNLP-概述

📅  最后修改于: 2020-11-23 03:52:04             🧑  作者: Mango


NLP是用于从自然语言源(例如网页和文本文档)中获取有意义和有用信息的一组工具。

什么是开放NLP?

Apache OpenNLP是一个开源Java库,用于处理自然语言文本。您可以使用此库构建高效的文本处理服务。

OpenNLP提供的服务包括令牌化,句子分段,词性标记,命名实体提取,分块,解析和共引用解析等。

OpenNLP的功能

以下是OpenNLP的显着功能-

  • 命名实体识别(NER) -Open NLP支持NER,即使在处理查询时,也可以使用NER提取位置,人员和事物的名称。

  • 汇总-使用汇总功能,您可以在NLP中汇总段落,文章,文档或其集合。

  • 搜索-在OpenNLP中,即使给定单词被更改或拼写错误,也可以在给定文本中标识给定的搜索字符串或其同义词。

  • 标记(POS) -NLP中的标记用于将文本分为各种语法元素,以供进一步分析。

  • 翻译-在NLP中,翻译有助于将一种语言翻译成另一种语言。

  • 信息分组-NLP中的此选项将文档内容中的文本信息分组,就像词性一样。

  • 自然语言生成-用于从数据库生成信息并自动执行信息报告,例如天气分析或医疗报告。

  • 反馈分析-顾名思义,NLP收集了人们对产品的各种类型的反馈,以分析产品成功赢得他们的心的程度。

  • 语音识别-尽管很难分析人类语音,但NLP具有一些内置功能可满足此要求。

开启NLP API

Apache OpenNLP库提供了用于执行自然语言处理的各种任务的类和接口,例如句子检测,标记化,查找名称,标记语音部分,对句子进行分块,解析,共同引用解析和文档分类。

除了这些任务,我们还可以为这些任务中的任何一个训练和评估我们自己的模型。

OpenNLP CLI

除了库之外,OpenNLP还提供了命令行界面(CLI),我们可以在其中训练和评估模型。我们将在本教程的最后一章中详细讨论该主题。

OpenNLP CLI

开放式NLP模型

为了执行各种NLP任务,OpenNLP提供了一组预定义的模型。该集合包括用于不同语言的模型。

下载模型

您可以按照以下步骤下载OpenNLP提供的预定义模型。

第1步-打开OpenNLP模型的索引页点击以下链接- http://opennlp.sourceforge.net/models-1.5/

OpenNLP模型

步骤2-访问给定的链接时,您将看到各种语言的组件列表以及下载它们的链接。在这里,您可以获得OpenNLP提供的所有预定义模型的列表。

预定义模型

通过单击它们各自的链接,将所有这些模型下载到文件夹C:/ OpenNLP_models />中。所有这些模型都依赖于语言,在使用它们时,必须确保模型语言与输入文本的语言匹配。

OpenNLP的历史

  • 2010年,OpenNLP进入了Apache孵化器。

  • 2011年,Apache OpenNLP 1.5.2孵化版发布,并于同年作为顶级Apache项目毕业。

  • 2015年,OpenNLP已发布1.6.0。