P25

  solr学习文档 文档

Solr 是一种可供企业使用的、开放源码的、基于 Lucene 的搜索服务器,solr实质上是基于Lucence的搜索套装,所有的搜索/索引能力都来着Lucence,solr干的都是打杂的活。

三笠雪 2017-05-25   1070   0
P9

  elasticsearch集群及应用 文档

假如我们建了一个web站点或者是一个应用程序,你就可能会需要添加搜索功能(因为这太有必要了),而事实上让搜索跑起来是有难度的,我们不仅想要搜索的速度快,而且还要安装方便(最好是无痛安装),另外模式定义要非常自由(schemafree),可以通过HTTP以JSON格式的数据来进行索引,服务器必须是一直可用的(HA高可用,这个不能丢),从一台机器能够扩展到成千上万台,然后搜索必须是实时的(real-time),使用起来一定要简单、支持多租户,我们需要一整套的解决方案。elasticsearch 的目标是解决上面的所有问题以及更多。它是开源的(Apache2协议),分布式的,RESTful的,构建在HYPERLINK"http://lucene.apache.org/"ApacheLucene之上的的搜索引擎.ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。

jombowang1 2017-02-13   1173   0
P44

  solr笔记 文档

Solr也是Apache下一个项目,它是使用java开发的,它是基于Lucene的全文搜索服务器。

wowwilliam 2016-12-27   934   0
P45

  solr教案 文档

Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr可以独立运行在Jetty、Tomcat等这些Servlet容器中。

wowwilliam 2016-12-27   969   0
P57

  分布式搜索+elasticsearch+方案研究+-+基础知识 文档

elasticsearch 分布式搜索框架基本上所有特性都包含了,分布式搜索,分布式索引,零配置,自动分片,索引自动负载,自动发现,restful 风格接口。

jeycash 2016-11-29   4144   0
P5

  flexiblesearch入门 文档

FlexibleSearch是Hybris提供的类SQL且基于Hybris Type System的搜索语言,语法比原生SQL要简单很多。

1147883997 2016-09-13   1532   0
P5

  搜索引擎命令大全 文档

1、双引号 把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。百度和Google 都支持这个指令。例如搜索: “企业SEO” 2、减号 减号代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。Google 和百度都支持这个指令。 例如:搜索 -引擎 返回的则是包含“搜索”这个词,却不包含“引擎”这个词的结果

对不对不对 2016-06-15   800   0
P21

  iSearch4性能优化之路 文档

iSearch4性能优化之路一浪概要引擎系统架构优化结果总结索引结构优化查询流程优化其他优化iSearch4引擎系统架构

defeqw 2015-12-01   467   0
P19

  iSearch5性能优化 文档

iSearch5的性能挑战iSearch5性能优化我们做了什么Searcherresultcache Bitmap索引索引截断索引排序索引分层其他优化Searcherresultcache35%query重复出现索引实时更新Cache失效策略结果合并100%性能提升上次查询时doc集合新增Bitmap索引宝贝类型:90%+是一口价类型的高频词:男女正品2013倒排求交,计算量大正排过滤,不适合高频词性能提升100%索引截断原始链A截断链B截断链C截断链性能提升70%索引排序绝大部分query和某几个类目相关很多term和某几个类目相关排序后性能30%排序后倒排索引大小下降30%排序前排序后索引分层分层前单集群分层后双集群性能提升30%其他优化异构机器调度大增量merge粗排

defeqw 2015-12-01   687   0
P15

  SearchPlanner-技术报告 文档

SearchPlanner-搜索共享业务平台亚夫曾经的淘宝搜索系统架构100+个不同应用调用搜索服务20+个不同功能的子系统构成了淘宝的搜索系统存在的问题:无法提供完整的搜索服务用户体验不一致,算法团队的各种创新成果不能共享存在严重的安全隐患引擎及其它系统更新换代困难各应用重复工作,效率低下现在的淘宝搜索系统架构解决了旧架构的各种不足,将N*M的复杂关系,变为了N+M各业务在SearchPlanner平台上互相融合,涌现出了一系列创新型业务,成为了一个创新支撑平台面临的技术挑战:稳定性开发效率数据驱动的业务快速迭代SearchPlanner整体架构提供三个层次的服务:完整的搜索业务服务搜索的基础服务平台的基础服务

defeqw 2015-12-01   1677   0
P21

  iSearch5 商品搜索特色功能 文档

iSearch5商品搜索特色功能引擎平台调度系统喜德iSearch5插件机制总述iSearch5正排定制iSearch5查询流程控制iSearch5截断与分层iSearch5引擎插件定制能力算分插件QRS插件文档处理插件动态摘要插件Functionexpression插件Sorter插件iSearch5正排定制

defeqw 2015-12-01   451   0
P31

  OpenSearch—可定制式开放云搜索平台 文档

OpenSearch—可定制式开放云搜索平台一淘及搜索事业部国泊(郭瑞杰)大纲个人介绍性能优化2008年7月毕业于中科院计算所,工学博士,研究方向实时搜索2008.8新的启程:重新实现查询引擎新的启程:组建团队,重新实现索引引擎(indexlib)1.反思:优化存储、online解耦飞天2.应用:全网搜索开启HA3准实时搜索时代(Swift+HA30.6)应用:CNZZ通用站内搜索(替换soso站内)1.提出产品想法2.团队组建&探路:外包式定制开放定制3.技术决策:与全网搜索服务必须分离

defeqw 2015-12-01   3000   0
搜索引擎   方案   HTTP   HTML   JSON  
P14

  iSearch演变历程 文档

iSearch演变历程太奕概述了解iSearch引擎历史变革iSearch遇到过哪些问题iSearch如何解决这些问题通过解决方案揭示iSearch的进化过程如何为iSearch的技术发展保驾护航iSearch引擎历史问题与挑战问题与挑战技术变革问题与挑战技术变革问题与挑战倒排容量优化正排容量优化保障机制用户对引擎的期望:能够支持更大领域的业务需求能够更快速的响应业务需求一个重要的前提:保证上线版本的服务质量保障机制

defeqw 2015-12-01   2673   0
P24

  ISearch5调度系统 文档

介绍一淘及搜索事业部-搜索技术-引擎平台-调度系统周鸿斌(悟非)内容提纲ISearch5AdminISearch5系统架构ISearch5 admin介绍异构机器不停服务切换大增量数据分发(DeployExpress)系统结构功能特性应用服务监控(Amonitor)系统结构功能特性

defeqw 2015-12-01   576   0
P12

  淘宝搜索业务架构优化 文档

淘宝搜索业务架构优化桂南Agenda在线架构业务双11优化搜索在线架构重点模块iSearch5:引擎平台,搜索服务的核心Opensearch:十分钟搭建搜索引擎SearchPlanner:搜索的总指挥UPS:个性化信息存储和计算CM:服务定位和流量切换工具支持的业务传统SRP主搜索一淘商品搜索天猫商品搜索店铺搜索店铺内搜索支持的业务传统SRP主搜索一淘商品搜索天猫商品搜索店铺搜索店铺内搜索比价优惠主搜索产品搜索一淘优惠购一淘优惠一淘比价页如意淘支持的业务传统SRP主搜索一淘商品搜索天猫商品搜索店铺搜索店铺内搜索比价优惠主搜索产品搜索一淘优惠购

defeqw 2015-11-30   4547   0
P33

  淘宝搜索离线系统介绍-技术报告 文档

淘宝搜索离线系统介绍一淘搜索事业部淘宝搜索dump中心木桑概要淘宝搜索的离线场景计算需求存储需求全量流程&增量流程集群运维开发管理展望Q&A淘宝搜索的离线场景离线场景约束条件结构化数据的完整性\准确性:数据量大而又要完整、准确,更新及时性:更新多源头又要同步,更新数据量大而又要实时性架构业务逻辑友好性:全量增量流程不同而又要业务代码一致等淘宝搜索业务简介09年前架构Dumpserver……Dumpserver07年:12台08年:48台OracleSearchEngineXML09年架构-引入map/reduce09年架构–job序列计算需求-09年架构的问题Job链太长;多次重复数据I/O;问题不好查;对数据库压力大;业务逻辑分散,开发效率不高;Job数量跟随业务膨胀;hdfs只有顺序写能力,没有随机读写;增量任务速度慢;计算需求-理想状态和数据库关联少;全量时间控制在2小时内,每天做一次全量(join)计算;

defeqw 2015-11-30   2271   0
P29

  搜索离线生产集群中的流计算 文档

搜索离线生产集群中的流计算莫问个人背景简介花名:莫问真名:王峰2006年毕业后加入公司雅虎中国(垂直搜索引擎团队)阿里云(云计算服务团队)淘宝/一淘(网页抓取团队)技术方向:搜索离线系统*提纲搜索离线系统技术体系Hadoop-2.0YARN介绍StreamService计算模型StreamService服务调度StreamService运维操作*搜索离线系统技术体系*HDFSYARNHBaseMapReduceStreamServiceHQueue搜索离线业务网页抓取数据处理数据统计PigHive数据挖掘…….Hadoop-1.0VSHadoop-2.0*ApplicationsonYARN*StreamService计算模型基本概念拓扑结构消息管理进度管理编程接口*基本概念StreamService:完成一套业务功能的流计算服务StreamRole:1个Role表示1组具备相同计算功能的计算单元StreamWorker:StreamRole中的计算单元StreamSource:StreamWorker的数据输入源StreamSink

defeqw 2015-11-30   546   0
P21

  ISearch5 实现原理之实时搜索 文档

应用场景实时引擎消息系统应用场景—主搜需求需要解决的问题性能优化更快的从异常中恢复更好的扩展性应用场景—主搜swiftdumphdfs实时引擎Disk Builder Doc Processor Chain Searcher Reader Query实时引擎—优化手段批量job可以利用offline计算资源做索引优化全局排序静态截断大增量merge实时引擎—大增量MergeMerge用于回收被标记删除的文档,减小物理内存和多segment对查询性能的影响引擎以version和segment为单位组织索引。每个version包含多个segment,segment中包括倒排(index)、正排(attribute)和详情(summary)MergeStrategy:指segment合并的策略,目前引擎提供optimize、balanceTree、realtime三种策略实时引擎—大增量MergeSearcherSegment_0IndexReader1Query实时引擎—按行切换

defeqw 2015-11-30   574   0
搜索引擎   Swift   Go  
P30

  百度Elasticsearch实践-高攀 文档

百度Elasticsearch大数据分析实践百度大数据部高攀2015年10月17日大纲背景介绍典型应用场景遇到的问题及经验分享对ES的优化与改进后期计划ES是啥有谁在用面向搜索(forfulltextsearch) 结构化数据分析文本数据分析ES在百度现状2013年10月开始使用目前覆盖百度内部20多个业务线包括casio、云分析、网盟、预测、文库、直达号、钱包、风控等单集群每天导入30TB+数据,总共每天60TB+单集群最大100台机器,200个ES节点共使用近300台机器

bger 2015-10-28   1636   0
P7

  Elasticsearch 分布式搜索配置文件详解 文档

 Elasticsearch是一个开源的分布式实时搜索与分析引擎,支持云服务。它是基于Apache Lucene搜索引擎的类库创建的,提供了全文搜索能力、多语言支持、专门的查询语言、支持地理位置服务、基于上下文的搜索建议、自动完成以及搜索片段(snippet)的能力。Elasticsearch支持RESTful的API,可以使用JSON通过HTTP调用它的各种功能,包括搜索、分析与监控。下面是讲述了elasticsearch分布式搜索配置文件各类参数的具体含义。

afreon 2015-08-04   612   0
1 2 3 4 5 6 7 8 9 10

关键词

最新上传

热门文档