P42

  分词系统研究完整版(ICTClAS) 文档

分词系统研究完整版  ICTClAS分词系统是由中科院计算所的张华平、刘群所开发的一套获得广泛好评的分词系统,难能可贵的是该版的Free版开放了源代码,为我们很多初学者提供了宝贵的学习材料。      

wccy100 2015-09-28   1463   0

Lucene3.0 的几种分词系统 博客

中文分词可以查看: http://www.open-open.com/74.htm 1、 StopAnalyzer StopAnalyzer 能过滤词汇中的特定字符串和词汇,并且完成大写转小写的功能。

openkk 2010-10-24   4678   0
Storm   ODF  

CWSharp - .Net中英文分词组件 经验

CWSharp 是 .Net 的中英文分词组件。 特性 内嵌多种分词算法及可扩展的自定义分词接口 StandardTokenizer BigramTokenizer StopwordTokenizer

mmntt 2015-07-20   35214   0

使用python进行汉语分词 经验

目前我常常使用的分词有结巴分词、NLPIR分词等等最近是在使用结巴分词,稍微做一下推荐,还是蛮好用的。一、结巴分词简介利用结巴分词进行 目前我常常使用的分词有结巴分词、NLPIR分词等等 最近是

ybw8 2015-06-07   18738   0

Jieba分词Go语言版本:GoJieba 经验

GoJieba 是 Jieba 分词的 Go 语言版本分词库。 用法 go get github.com/yanyiwu/gojieba 示例代码请见 example/demo.go cd example

jopen 2015-09-15   38485   0

Genius 分词 3.1.6 版本发布 资讯

Genius 分词 3.1.6 版本发布 本次更新的主要更新: 1、修复在python3.x情况下,默认系统编码不为utf8导致无法安装的情况。 2、修复wapiti在python3.x下调用出错问题。

jopen 2014-10-27   7287   0
Genius  

谷歌三大核心技术(二)Google MapReduce中文 经验

Google MapReduce中文版 译者: alex 摘要 MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于 key/value

fmms 2012-02-08   280103   0
P22

  JetSpeed-2 技术资料中文翻译 文档

JetSpeed-2技术资料 目 录 JETSPEED2.0 概述 3 JETSPEED-2 工作流程 6 JETSPEED-2安全机制 9 JETSPEED-2的PORTAL BRIDGE 11 1

s12345uper 2012-08-16   3303   0

【同行说技术】不能不看的Java资源大全(中文版) 资讯

师博主交流群:391519124,分享你的博文,和大牛们一起交流技术~ 一、Java资源大全中文版【福利】 Java资源大全中文版,包括开发库、开发工具、网站、博客、微信、微博等 二、Java程序员使用的20几个大数据工具

jopen 2016-02-04   30861   0

Java OCR 图像智能字符识别技术,可识别中文 经验

和汉王OCR,看了很多的OCR技术发现好多对英文与数字的支持都很好,可惜很多都不支持中文字符。 Asprise-OCR,Tesseract 3.0以前的版本,都不支持中文,其实我用了下Asprise-

jopen 2013-03-13   308584   0

谷歌三大核心技术(三)Google_BigTable中文 经验

Bigtable是一个分布式的结构化数据存储系统,它被设计用来处理海量数据:通常是分布在数千台普通服务器上的PB级的数据。Google的很 多项目使用Bigtable存储数据,包括Web索引、Google Earth、Google Finance。这些应用对Bigtable提出的要求差异非常大,无论是在数据量上(从URL到网页到卫星图像)还是在响应速度上(从后端的批量处理到 实时数据服务)。

fmms 2012-02-09   209985   0

谷歌三大核心技术(一)Google File System中文 经验

The Google File System中文版 译者:alex 摘要 我们设计并实现了Google GFS文件系统,一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。GFS虽然运行在廉价的普

fmms 2012-02-09   406182   0

Windows 10中文技术预览版个人试用报告 资讯

使用虚拟机安装 在虚拟机上安装这个版本,装的时候会提示“找不到驱动程序”的经典问题。在这种情况下也可以尝试用多种方法解决。 官方的办法简单粗暴:直接升级到最新版 Parallels 就可以了。但是有些人用的并非正版。

jopen 2015-01-25   6570   0
P10

  搭建sphiSphinx+MySQL5.1x+SphinxSE+mmseg中文分词搜索引擎架构 文档

Sphinx+MySQL5.1x+SphinxSE+mmseg中文分词 搜索引擎架构搭建手记 研究了一下sphinx,发现真是个好东西,先来几句废话, 什么是Sphinx Sphinx 是一个在GPLv2

xlong07 2012-01-05   648   0

Highcharts 中文API 中文手册 经验

Highcharts 中文API 中文手册

jopen 2016-01-15   112160   0

做好的技术VS用技术做好的事情 资讯

70 多岁就足够了的争论。 那么,药品是好的,还是坏的?做为科学技术领域的一名投资者,对我而言,这是不同寻常的问题。随着技术进步和令人惊奇的、用于创造强大工具的脚步加快,这个问题对于地球上的每个人来说,正变得息息相关。

jopen 2015-11-12   6853   0
技术  

好的技术领导与差的技术领导 资讯

1 团队合作 一个优秀的技术领导 必 然是团队的一份子,他们认为当整个团队成功时自己才称得上成功。他们不仅要做好繁杂和不讨好的本职工作,还要清除项目中的障碍,从而让整个团队能够以 100%的效率运转起

jopen 2015-04-18   5688   0
技术  

技术主管VS坏技术主管 资讯

VS 平庸的产品经理》启发,写下了此文。 本文主要针对几个方面,对好技术主管和坏技术主管进行比较。 团队协作 优秀的技术主管把自己视作团队成员,团队的成功就是自己的成功。他们会去承担一些吃力

cncde 2015-12-01   7633   0
主管  

技术债务和技术投资 资讯

debt and technical investment 技术债务 技术债务,是软件工程讨论折衷方案时所用到的一种工具。当你遇到技术债务 注1 时,你就会堆积一些快速、肮脏的代码,它们更难以维护

jopen 2016-01-14   13148   0
P9

  搜索引擎solr环境配置、分词及索引操作 文档

conf/server.xml 添加编码的配置 URIEncoding="UTF-8" (如不添加,中文检索时因为乱码搜索不到) 3、 配置solr Tomcat conf/Catalina/localhost下添加solr

huafenged 2012-11-22   3997   0
1 2 3 4 5 6 7 8 9 10