solr数据增量更新思路

11年前
solr 可以将数据源 在solr服务器上建立索引,已提供企业查询
 数据源:可以是文本,pdf,数据库等
 这里只初探数据库
1: 首先是配置 数据库的连接
2:在配置文件里面 作相应的entry实体 处理语句
下面是对应的含义

query:获取数据元的数据

deletedpkquery:增量删除,更新solr删除文档

deltaQuery语句是用于增量导入(Delta Import)中获取符合增量导入标准的数据的主键的SQL,供deltaImportQuery查询使用。它将数据表中每一笔记录执行写操作的时候更新字段last_index_time为当前系统时间,这句sql是从数据表中取出更新字段比solr上次更新时间晚的记录,加入或更新到solr索引。

deltaImportQuery语句增量导入(Delta Import)中获取需要增量索引数据(document)的字段(field)

solr 是根据配置的语句 去作相应的事,可以理解为 solr根据我们自己配置的sql,去数据库取出数据,再更新索引文档,
如何保证增量呢 ,  1:首页要有数据库方面的字段设计,一般字段设计会有 一个字段表示 最后更新时间
然后 通过 where last_index_time 与数据库中的最后更新时间,作比较,就能取出增量更新数据 ,
last_index_time  是solr服务器,在全量或者增量导入数据是,每个对应的最后导入时间,在solr\collection1\conf\dataimport.properties文件里面