复旦大学推出基于云的自然语言处理开源项目FudanNLP

jopen 9年前

在上海复旦大学计算机学院邱锡鹏教授的带领下,该学院研发出一套基于机器学习的中文自然语言文本处理开发工具包——复旦自然语言处理(FNLP),该工具包包含了为实现这些任务的机器学习算法和数据集。

  几分钟内,在 100 万条用户反馈中筛选出有价值的用户需求;1 秒钟内,各种在线机器人的对来自世界各地的用户问题的即时响应;类似以上这些神奇场景的背后,都有着自然语言处理(Natural Language Processing,简称 NLP)的深度应用。

  在上海复旦大学计算机学院邱锡鹏教授的带领下,该学院研发出了一套基于机器学习的中文自然语言文本处理的开发工具包——复旦自然语言处理(FudanNLP ,简称 FNLP)。该工具包包含了为实现这些任务的机器学习算法和数据集。

  FNLP 所具有的训练、自我学习及其强大的语义分析能力,其对所部属的服务器的计算能力,数据的可靠性,访问性能,有着较高的要求。为了可以让更多的人了解、使用 FNLP,降低 FNLP 的部署、维护的成本,降低运用复旦自然语言处理的门槛,上海云角信息技术科技有限公司(微博:@云角 YunGoal)的云计算专家团队帮助复旦与微软将 FNLP 和与 Microsoft Azure 结合,基于 FNLP 的开源包,在 Microsoft Azure 上搭建了一个中文语言文本处理的平台——NLP on Azure。

  对于想预览或者运用 FNLP 的用户,利用了 Microsoft Azure,就可以在几分种内完成 NLP on Azure Website 的部署,立即开始对 FNLP 各种特性的试用。或者以 REST API 的形式调用 FNLP 的语言分析功能。

  NLP on Azure 平台的功能主要由 3 部分组成:

  • 从 web 页面直接输入文本,用于基础的文本分析测试。提供的功能有分词,词性标注,关键字提取,语法分析,文本分类,文本聚类等功能。

  • 提交大规模的文本分析任务,用于大规模文本的分析,以及用对 FNLP 的训练。

  • 以 REST API 的形式,开发调用接口。

  更加详细的使用、部署、开发信息,请参考项目文件夹下的使用及开发部署文档

  目前云角已将 NLP on Azure 项目代码和部署包托管到 CSDN CODE 这个平台。NLP on Azure 项目遵循 Apache Licene 2.0 协议,希望能通过 NLP on Azure 平台上充分享受 Azure 带来的各种云服务优势,以及 FNLP 的强大语言处理功能。

  NLP on Azure 项目托管地址:https://code.csdn.net/Yungoal-Research/azure_nlp/tree/master

  使用及开发文档https://code.csdn.net/Yungoal-Research/azure_nlp/tree/master/Documents

来自: CSDN