盘点大数据开源软件Google Trends指数 资讯

可以直接为存储在HDFS或HBase中的Hadoop数据提供快速、交互式的SQL查询。 Elasticsearch 是一个基于Lucene的搜索服务器。它提供了一个分布式、支持多用户的全文搜索引擎,基于RESTful web接口。E

jopen 2017-04-06   46308   0

Nutch Hadoop 教程 博客

http://cvs.apache.org/dist/lucene/nutch/nightly/ http://cvs.apache.org/dist/lucene/hadoop/nightly/ 我使用

Hadoopp 2012-09-28   6548   0
屌丝  

NoSQL 数据建模技术 经验

Cassandra 文档数据库: MongoDB, CouchDB 全文索引: Apache Lucene, Apache Solr 图数据库: neo4j, FlockDB 概念技术 Conceptual

jopen 2013-05-15   33442   0

NoSQL 数据建模技术 经验

Cassandra 文档数据库: MongoDB, CouchDB 全文索引: Apache Lucene, Apache Solr 图数据库: neo4j, FlockDB 概念技术 Conceptual

fmms 2012-05-14   92768   0
P6

  Liferay Portal 4.1.2 – 快速入门指南 文档

deploy.dir=/home/liferay/deploy Lucene的缺省位置 lucene.dir=/home/liferay/lucene/ 缺省的主题与色彩方案 default.theme.id=classic

eglx 2011-05-12   597   0

Elasticsearch 学习笔记 经验

Elasticsearch 是一个建立在全文搜索引擎 Apache Lucene(TM) 基础上的搜索引擎. 当然 Elasticsearch 并不仅仅是 Lucene 那么简单,它不仅包括了全文搜索功能,还可以进行以下工作:

jopen 2015-12-15   28102   0
P10

  大数据平台技术框架选型分析 文档

率和删除困难。 搜索引擎 Nutch 开源Java 实现的搜索引擎,诞生Hadoop的地方。 Lucene 一套信息检索工具包,但并不包含搜索引擎系统,它包含了索引结构、读写索引工具、相关性工具、排序等功能。

guet_lee 2017-01-12   675   0
P10

  Solr的使用说明文档 文档

亮,这个时候可以用下面的方法 query.setParam("hl.q", "lucene solr");只对lucene和solr关键字进行高亮显示(solr不作为搜索条件也可以) 9:显示第一个匹配关键字附近的部分内容

Swear_Max 2013-01-15   608   0
P9

  Nutch 主要类分析 文档

nutch.crawl.Indexer:     这个类的任务是另一方面的工作了,它是基于hadoop和lucene的分布式索引。它就是为前面爬虫抓取回来的数据进行索引好让用户可以搜索到这些数据。     这里

228823266 2012-01-17   5175   0

在python中使用elasticsearch做为搜索引擎 代码段

一直想找一个快速全文搜索的工具,目前找到的有Sphinx,xapian,Lucene,solr, elasticsearch ,whoosh,hyper estraier等,原本一直不太喜欢用java

fnme 2014-12-31   3422   0

Java实现的网络爬虫,Apache Nutch v2.3 发布 资讯

Nutch的创始人是 Doug Cutting ,他同时也是Lucene、Hadoop和Avro开源项目的创始人。 Nutch 诞生于2002年8月,是Apache旗下的一个用Java实现的开源搜索引擎项目,自Nutch1

m4ed 2015-01-31   18141   0

elasticsearch的bulk操作 经验

关于flush refresh只是将内存的segment刷回到文件系统缓存( 刷到文件系统缓存中lucene就可以检索这个segment ),还没有到磁盘。es在将数据写入内存buffer同时,会写一份

goby1220 2016-02-14   68034   0

分布式数据库架构--排序、分页、分组、实现 经验

解决问题。也可以充分利用海量数据存储(Hadoop-HDFS|Hive|HBse)、搜索引擎(Lucene|Solr)及分布式计算(MapReduce)等技术来解决问题。 别外,也可以用NoSQL

jopen 2014-09-20   40840   0

JAVA开源CMS - PublicCMS 经验

静态化页面模板文件存储目录,data\indexes子目录为Hibernate Search/lucene索引文件目录,data\pages子目录为PublicCMS推荐位数据存储目录 以上目录路径可

zyyy358 2015-08-26   80570   0

提高solr的搜索速度 经验

是150ms左右。(使用solr架构的搜索服务) 在一次技术群中,中听到一位sina的架构师,他们是采用基于lucene做的搜索服务,索引在20多G数据量,差不多是在亿的级别上,PV量在500万/天左右,高峰时期500个并发量/s,采用的是增量索引

FelicaEdge 2016-02-21   10274   0

solr服务器配置与tomcat整合 经验

最近找了视频学习lucene和solr,记一下怎么配置solr JDK使用的为1.7,如果用1.6貌似会提示版本低 先下载solr3.5和mmseg4j1.8.5的压缩包,下载链接在底部 解压solr3

dy223 2015-03-27   16058   0

Java NoSQL数据库, OrientDB 2.0 正式发布 资讯

in database at creation time and can be update Lucene plugin for Full-Text and Spatial indexes is now

jopen 2015-01-20   10556   0

Java 的 PDF 处理类,Apache PDFBox 1.8.11 发布 资讯

行实用工具。 主要特性包括: 从PDF提取文本 合并PDF文档 PDF 文档加密与解密 与Lucene搜索引擎的集成 填充PDF/XFDF表单数据 从文本文件创建PDF文档 从PDF页面创 建图片

jopen 2016-01-18   11492   0

Solr源码在MyEclipse下的搭建 经验

-version 显示版本号则安装成功 2. 下载Solr源码 下载地址: http://lucene.apache.org/solr/mirrors-solr-latest-redir.html

jopen 2015-01-23   19329   0

nodejs 版本开源全文搜索引擎:addon 经验

require('seamsearch'); //需要索引的数据,用一个数组表示。每个数组项又是一个数组,表示一个document(lucene里面的document同理),这里的每 个数组项表示一个字段,分别由name,type,val

jopen 2014-03-18   17643   0
1 2 3 4 5 6 7 8 9 10