开源项目,开源代码,开源文档,开源新闻,开源社区

cut Golang写的中文分词开发包。参考 sego 两个重要方法 // Dictionary结构体实现了一个字串前缀树， // 一个分词可能出现在叶子节点也有可能出现在非叶节点 type

jopen 2015-10-24 16418 0

cut Google Go/Golang开发

Friso是使用C语言开发的一款高性能中文分词器，使用流行的mmseg算法实现。完全基于模块化设计和实现，可以很方便的植入到其他程序中，例如：MySQL，PHP等。同时支持对UTF-8/GBK编码的切分。

jopen 2014-01-03 39436 0

中文分词

"结巴"中文分词的R语言版本，支持最大概率法（Maximum Probability），隐式马尔科夫模型（Hidden Markov Model），索引模型（QuerySegment），混合模型（M

jopen 2014-11-04 111493 0

jiebaR 中文分词

IKAnalyzer中文分词，计算句子相似度一、简介 IKAnalyzer 是一个开源的，基于java语言开发的轻量级的中文分词工具包。以开源项目Luence为应用主体的，结合词典分词和文法分析算法

jopen 2015-01-22 174851 0

中文分词 IKanalyzer

apache.org/ 下载中文分词IK Analyzer： http://code.google.com/p/ik-analyzer/downloads/list （注意下载的是IK Analyzer

玫瑰情书 2014-05-26 85297 0

Lucene 中文分词 Lucene中文分词 Lucene开发实例

的首字母缩写（即：简易中文分词系统）。这是一套基于词频词典的机械式中文分词引擎，它能将一整段的中文文本基本正确地切分成词。词是中文的最小语素单位，但在书写时并不像英语会在词之间用空格分开，所以

jopen 2014-10-10 15526 0

SCWS PHP开发

虽然Elasticsearch有原生的中文插件elasticsearch-analysis-smartcn（实际上是lucence的org.apache.lucene.analysis.cn.smart

码头工人 2015-06-05 33980 0

ElasticSearch 搜索引擎

本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。

RozAlford 2016-09-05 11758 0

中文分词开源 Java Java开发

Java分布式中文分词组件 - word分词 word 分词是一个Java实现的分布式的中文分词组件，提供了多种基于词典的分词算法，并利用ngram模型来消除歧义。能准确识别英文、数字，以及日期、时间

xg48 2015-04-10 27874 0

word分词

本文的目标有两个： 1、学会使用9大Java开源中文分词器 2、对比分析 9大Java开源中文分词器的分词效果 9大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口：

yn6e 2015-05-10 75187 0

Java 中文分词

是一个完整的全文检索引擎，而是一个全文检索引擎的架构，提供了完整的查询引擎和索引引擎。开发人员可以基于Lucene.net实现全文检索的功能。 Lucene.net工作原理 Lucene.net

jopen 2014-09-23 97435 0

Lucene 搜索引擎 Lucene.net

尽管在最近的在线搜索中已经占据高的搜索量，深度学习仍然是一个相对较新的概念。由于在各个不同的领域都获得了巨大的成功，机器学习在研究和生产领域中大量涌现。机器学习是应用深度神经网络技术的一个过程——也就是有着

DalXlr 2016-10-20 10902 0

深度学习机器学习

P3

首先，介绍一下IK的整个分词处理过程： 1. Lucene的分词基类是Analyzer，所以IK提供了Analyzer的一个实现类IKAnalyzer。首先，我们要实例化一个IKAnalyzer，它

chennaid 2011-12-19 471 0

搜索引擎

P7

Lucene3.0分词原理与分词系统分词原理建立索引和查询的过程中，都是以基本的语素项为单位的。基本的语素项就是通过分词得到。这个过程决定了索引单元金额最终的匹配过程。分词在文本索引的建立过程

lxfsbxh 2010-12-17 503 0

Lucene 搜索引擎 lucene分词系统源代码

谷歌4亿英镑收购人工智能公司DeepMind，百度目前正推进“百度大脑”项目，腾讯、阿里等各大巨头布局深度学习。随着社会化数据大量产生，硬件速度上升、成本降低，大数据技术的落地实现，让冷冰冰的数据具有智慧逐

jopen 2014-09-16 78040 0

数据挖掘

百度余凯团队最新力作《基于深度学习的图像识别进展百度的若干实践》，作者：都大龙、余轶南、罗恒 ,其他作者：张健、黄畅、徐伟、余凯。《中国计算机学会通讯》，第11卷第4期，2015年4月。本文

jopen 2015-04-14 211668 0

深度学习

Keras是一个简约，高度模块化的神经网络库。采用Python / Theano开发。使用Keras如果你需要一个深度学习库：可以很容易和快速实现原型（通过总模块化，极简主义，和可扩展性）同时支持卷积网络（visi

jopen 2015-03-29 79390 0

Keras 机器学习

Robbe是建立在Friso中文分词器上的一个高性能php中文分词扩展，除了提供了基本的分词函数以外，还提供一些编码转换函。 Robbe完整版本(PHP测试程序, 开发帮助文档, WinNT下php各版本的dll文件)下载:

jopen 2014-01-03 57878 0

中文分词

一。friso中文分词器 friso是使用c语言开发的一个中文分词器，使用流行的mmseg算法实现。完全基于模块化设计和实现，可以很方便的植入到其他程序中，例如：MySQL，PHP等。 1。目前最高版本：friso

jopen 2012-12-29 64757 0

C语言中文分词

MeCab 是一套日文分词（形态分析）和词性标注系统（Yet Another Part-of-Speech and Morphological Analyzer）， rick 曾经在这里分享过 MeCab

jopen 2015-01-21 33833 0

中文分词

Golang的中文分词开发包：cut 经验

C语言开源高性能中文分词器经验

"结巴"中文分词的R语言版本：jiebaR 经验

利用IKAnalyzer中文分词，计算句子相似度经验

Lucene开发实例：Lucene中文分词经验

PHP中文分词扩展 SCWS 经验

基于IKAnalyzer实现一个Elasticsearch中文分词插件经验

11大Java开源中文分词器的使用方法和分词效果对比经验

Java分布式中文分词组件word分词v1.2发布资讯

9大Java开源中文分词器的使用方法和分词效果对比经验

Lucene.net入门学习（结合盘古分词）经验

解读14个深度学习关键词经验

深入IK分词器文档

Lucene3.0分词系统文档

数据挖掘-分词入门经验

基于深度学习的图像识别进展资讯

基于Theano的深度学习库：Keras 经验

php高性能开源中文分词扩展经验

C语言开源高性能中文分词器：friso 经验

用MeCab打造一套实用的中文分词系统经验

基于深度学习的词位标注中文分词的相关搜索

关键词

Golang的中文分词开发包：cut 经验

C语言开源高性能中文分词器 经验

"结巴"中文分词的R语言版本：jiebaR 经验

利用IKAnalyzer中文分词，计算句子相似度 经验

Lucene开发实例：Lucene中文分词 经验

PHP中文分词扩展 SCWS 经验

基于IKAnalyzer实现一个Elasticsearch中文分词插件 经验

11大Java开源中文分词器的使用方法和分词效果对比 经验

Java分布式中文分词组件word分词v1.2发布 资讯

9大Java开源中文分词器的使用方法和分词效果对比 经验

Lucene.net入门学习（结合盘古分词） 经验

解读14个深度学习关键词 经验

深入IK分词器 文档

Lucene3.0分词系统 文档

数据挖掘-分词入门 经验

基于深度学习的图像识别进展 资讯

基于Theano的深度学习库：Keras 经验

php高性能开源中文分词扩展 经验

C语言开源高性能中文分词器：friso 经验

用MeCab打造一套实用的中文分词系统 经验

基于深度学习的词位标注中文分词 的相关搜索

关键词

C语言开源高性能中文分词器经验

利用IKAnalyzer中文分词，计算句子相似度经验

Lucene开发实例：Lucene中文分词经验

基于IKAnalyzer实现一个Elasticsearch中文分词插件经验

11大Java开源中文分词器的使用方法和分词效果对比经验

Java分布式中文分词组件word分词v1.2发布资讯

9大Java开源中文分词器的使用方法和分词效果对比经验

Lucene.net入门学习（结合盘古分词）经验

解读14个深度学习关键词经验

深入IK分词器文档

Lucene3.0分词系统文档

数据挖掘-分词入门经验

基于深度学习的图像识别进展资讯

php高性能开源中文分词扩展经验

用MeCab打造一套实用的中文分词系统经验

基于深度学习的词位标注中文分词的相关搜索