P50

  NoSQL 综述 文档

Cassandra 文档数据库: MongoDB, CouchDB 全文索引: Apache Lucene, Apache Solr 图数据库: neo4j, FlockDB 五、NoSQL数据模型及分类

wei5445 2012-03-21   748   0
P136

  《中国电信eda总体规范-技术与架构分册》初稿 文档

合的一体化方法。 英文分词的工具算法包流行的有Lucene,它是一套用于全文检索和搜寻的开放源码程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索

allenlei 2016-09-13   1864   1
P77

  java_面试_总结版 文档

问我如何才能提高网站的性能,我根据自己在项目中的经验以及自己以前阅读的 关于优化方面的资料给他提出了很多建议,如用lucene进行全文检索,用memcached 进行分布式缓存,以及通过spring定时器结合freeMarker模板引擎来生成静态

lrq120011 2017-04-10   812   0
P75

  Java综合知识点总结 文档

问我如何才能提高网站的性能,我根据自己在项目中的经验以及自己以前阅读的 关于优化方面的资料给他提出了很多建议,如用lucene进行全文检索,用memcached 进行分布式缓存,以及通过spring定时器结合freeMarker模板引擎来生成静态

744452049 2016-08-04   5435   0
P19

  Sphinx搜索引擎架构与使用文档(和mysql结合)v1.1 文档

许可协议下发行。 Sphinx的特征: ·Sphinx支持高速建立索引(可达10 MB/秒,而Lucene建立索引的速度是1.8MB/秒) ·高性能搜索(在2-4 GB的文本上搜索,平均0.1秒内获得结果)

webphp 2011-02-19   566   0

以Amazon、豆瓣网为例,探索推荐引擎内部的秘密 经验

的协同过滤算法的高效实现。Apache Mahout 是 ASF 的一个较新的开源项目,它源于 Lucene,构建在 Hadoop 之上,关注海量数据上的机器学习经典算法的高效实现。 感谢大家对本系列的关注和支持。

jopen 2014-12-12   59273   0

大数据相关技术、Hadoop生态、LinkedIn内部实战 经验

非常NB的系统,但没人见过,在工业界很多人痒痒的就想按其思想去仿作,当时Apache Nutch Lucene的作者Doug Cutting也是其中之一,后来他们被Yahoo收购,专门成立Team去投入做

jopen 2015-01-26   192894   0
P92

  Jdon Framework 开源框架 文档

传统数据库事务或会话事务。 可将原来一整块事务切分成多个单个事务处理器(消费者) 比如:保存到数据库和lucene文件如果捆绑在一个事务,由于文件保存很慢,导致数据库保存拖延,可切分成两个事件消费者异步实现。

colabox 2013-01-24   5317   0
JEE框架   方案   Apache   HTTP   Java  
P17

  剖析多租户-SaaS-PaaS 文档

e.com的应用而言,同样如此,Force.com为此内置一个全文检索引擎,其是基于大名鼎鼎的Lucene技术。当一个运行在Force.com平台上的应用对数据库中数据进行更新的时候,会有一组称为检索

xrogzu 2015-11-13   2333   0
P7

  王鹏云:实时搜索架构分析 文档

所有特性和代码都是他们自己做小白鼠,在他们产品线已经实验通过后才会发布到开源版本里面,是基于LUCENE的项目,也提供了一个 SOLRPLUGIN,SOLR对这个进行非常好的封装。这个只是一个搜索库

foreveract 2013-05-26   2298   0
P20

  大型网站架构技术方案集锦 文档

其出发点有些类似于数据库的分区,差别可能就是不再一个库上吧,其实都是结合业务和应用来对一些数据对象进行分割。 搜索服务器用的是 Lucene。 进一步阅读: · Digg Architecture · How Digg.com uses

909910149 2011-07-07   698   0
P44

  中国移动Big Cloud平台(经分培训)v1.0 文档

集群管理系统同样的结构 15. Hadoop 开源云计算平台:Doug Cutting改进于Lucene搜索引擎,由Yahoo、Facebook主导Hadoop是Google云计算分析平台的开源实现!应用层

ljp123456 2014-03-22   2311   0

NoSQL数据库的四大家族 经验

在应用代码层进行大量的改动。 CouchDB是面向文档的数据库,存储半结构化的数据,比较类似lucene的index结构,特别适合存储文档,因此很适合CMS,电话本,地址本等应用,在这些应用场合,文

TravisGodin 2016-09-26   38097   0

讲给硅谷创业者的大数据精华集合 经验

非常NB的系统,但没人见过,在工业界很多人痒痒的就想按其思想去仿 作,当时Apache Nutch Lucene的作者Doug Cutting也是其中之一,后来他们被Yahoo收购,专门成立Team去投入做,就

jopen 2015-01-25   84829   0
P16

  Map/Reduce工作原理 文档

Hadoop: 第一节 Hadoop是什么 Hadoop是什么 Hadoop原来是Apache Lucene下的一个子项目,它最初是从Nutch项目中分离出来的专门负责分布式存储以及分布式运算的项目。简

jsyzthz 2011-08-13   8574   0
P39

  存储简单简介 文档

e项目nutch的基础结构而创建,HDFS是hadoop项目的一部分,而hadoop又曾经是是lucene的一部分。 具有数据一致性。适合一次写入多次读取的模型,客户端在文件没有被成功创建之前是无法看到文件存在的;

lyglyg1394 2016-04-12   2096   0
方案   手册   Swift   Go   ini  
P66

  开发人员面试宝典(Java版) 文档

Axis2 的配置 56 6.26 spring定时器 56 6.27 Ext概述 57 6.28 lucene的概述 57 6.29 线程池作用 58 6.30 jbpm是如何和spring进行整合 58

744452049 2016-08-04   2789   0

Java处理PDF文件的类库,PDFBox 2.0.0 RC2 发布 资讯

主要特性包括: 从PDF提取文本 合并PDF文档 PDF 文档加密与解密 与Lucene搜索引擎的集成 填充PDF/XFDF表单数据 从文本文件创建PDF文档 从PDF页面创

jopen 2015-11-22   48306   0
PDFBox  

每个软件工程师都应该知道的有关实时数据的统一概念 经验

流处理器可以把它的状态保存在本地的表或索引-- bdb ,或者 leveldb ,甚至于类似于 Lucene 或 fastbit 一样不常见的索引。这些内容存储在它的输入流中(或许是使用任意的转化)。生

jopen 2014-02-10   98975   0
P44

  the log:每个程序员都应该知道有关实时数据的统一抽象 文档

流处理器可以把它的状态保存在本地的『表』或『索引』中 —— bdb、leveldb 甚至是些更不常见的组件,如Lucene 或fastbit索引。 这样一些存储的内容可以从它的输入流生成(可能做过了各种转换后的输入流)。

june.zk 2016-09-12   479   0
1 2 3 4 5 6 7 8 9 10