Java内容仓库API,Apache Jackrabbit Oak 1.0.3 发布

jopen 10年前

Apache Jackrabbit 是由 Apache Foundation 提供的 JSR-170 的开放源码实现.
jlogo.gif

Apache Jackrabbit Oak 1.0.3 发布,此版本现已提供下载

Oak 1.0.3  --------------------    改进      [OAK-1966] - Add Hint for selecting more performant index in ...    [OAK-1967] - Avoid collision marker update when already present    [OAK-1983] - Query: reduce debug log output    [OAK-1986] - Log index names for which AsyncIndexUpdate would trigger a ...    [OAK-1987] - LuceneIndex should access Lucene Directory if query ...    Bug 修复      [OAK-1816] - Oak#createContentRepository never unregisters some of its ...    [OAK-1964] - Performance degradation due to SessionDelegate.WarningLock    [OAK-1968] - Wrong time unit for async index lease time    [OAK-1969] - Duplicate observation events when using JackrabbitEventFilter    [OAK-1972] - Async property index update may fail on DocumentMK with more ...    [OAK-1973] - IndexUpdate traverses the data nodes under index nodes    [OAK-1975] - Wrong values reported for OBSERVATION_EVENT_DURATION    [OAK-1982] - Ordered index must ignore full-text queries    [OAK-1991] - Optimize access to OrderedPropertyIndex      此版本包括 Apache Jackrabbit Oak 1.0.2 版本的所有改进。更多更新内容请看。
JSR-170把自己定义为一个能与内容仓库互相访问的,独立的,标准的方式。同时它也对内容仓库做出了自己的定义,它认为内容仓库是一个高级的信息管理 系统,该系统是是传统的数据仓库的扩展,它提供了诸如版本控制、全文检索,访问控制,内容分类、访问控制、内容事件监视等内容服务。

Java Content Repository 
API(JSR-170)试图建立一套标准的API去访问内容仓库。如果你对内容管理系统(CMS)不熟悉的话,你一定会对内容仓库是什么感到疑惑。你可 以这样去理解,把内容仓库理解为一个用来存储文本和二进制数据(图片,word文档,PDF等等)的数据存储应用程序。一个显著的特点是你不用关心你真正 的数据到底存储在什么地方,是关系数据库?是文件系统?还是XML?不仅仅是数据的存储和读取,大多数的内容仓库还提供了更加高级的功能,例如访问控制, 查找,版本控制,锁定内容等等。

一段时间以来市场上出现了各个厂家开发的不同的CMS系统,这些系统都建立在他们各自的内容仓库之上。
问题出现了,每个CMS开发商都提供了他们自己的API来访问内容仓库。这对应用程序的开发者带来了困扰,因为他们要学习不同的开发商提供的API,同时,他们的代码也与这些特定的API产生了绑定。

JSR-170正是为解决这一问题而出现的,它提供了一套标准的API来访问任何数据仓库。通过JSR-170,你开发代码只需要引用 javax.jcr.* 这些类和接口。它适用于任何兼容JSR-170规范的内容仓库。

我们将通过一个 例子 来逐步了解JSR-170。

为什么需要 Java Content Repository API

随着各个厂家各自的内容仓库实现数量的增长,人们越来越需要一组通用的编程接口来使用这些内容仓库,这就是JSR-170所要做的东西。它提供一组通用的 编程接口来连接内容仓库。你可以把JSR-170理解为和JDBC类似的API,这样你可以不依赖任何具体的内容仓库实现来开发你的程序。你可以直接使用 支持JSR-170的内容仓库;或者如果一些厂家的内容仓库不支持JSR-170则可以通过这些厂家提供的JSR-170驱动来完成从JSR-170与厂 家特定的内容仓库的转换。

下面这张图描述了使用JSR-170开发的应用系统的结构。在该系统运行的时候,它可以操作内容仓库1,2,3中的任意一个。在这些内容仓库当中,只有2 是直接支持JSR-170的,剩下的两个都需要JSR-170驱动来和应用系统交互。注意:你的应用系统完全不用关心你的数据是如何存储的。1可能使用了 关系数据库来存储,而2使用了文件系统,至于上,它甚至更前卫的使用了XML。

Java内容仓库API,Apache Jackrabbit Oak 1.0.3 发布

JSR-170 API对不同的人员提供了不同的好处。

●对于开发者无需了解厂家的仓库特定的API,只要兼容JSR-170就可以通过JSR-170访问其仓库。
●对于使用CMS的公司则无需花费资金用于在不同种类CMS的内容仓库之间进行转换。
●对于CMS厂家,无需自己开发内容仓库,而专注于开发CMS应用。


JSR-170 是这样定义内容仓库的,内容仓库由一组 workspace(工作空间)组成,这些workspace通常应该包含相似的内容。一个内容仓库有一个到多个 workspace。每个workspace都是一个树状结构,都有一个唯一的树根节点(root node)。树上的item(元素)或者是个node(节点)或者是个property(属性)。每个node都可以有零个到多个子节点和零个到多个子属 性。只有根节点没有父节点,其余所有的节点都有一个父节点。property 也必须有一个父节点,但它没有子节点或是子属性,property 是叶子元素。property是真正存储数据的元素。

下图描述了一个blog应用程序的内容仓库模型。每个root node(根节点)的子节点都代表了一个blog实体。与这个blog实体有关的数据都存储在 bolgEntry 节点的属性里,其中一个 blogAttachment property 存储了一个二进制图片文件。
Java内容仓库API,Apache Jackrabbit Oak 1.0.3 发布
根据内容仓库实现的功能,JSR-170定义了三种级别:
Level 1:定义了一个只读的内容仓库。功能包括读取内容,将内容导出为XML和查找内容。
Level 2:定义了可写的内容仓库。Level 2是Level 1的扩展,新增的功能包括往内容仓库里写入内容,和从XML导入数据到仓库。
Advanced options:定义实现五种附加功能,版本控制、JTA、SQL查询、清晰的内容锁定和监视。

什么是Apache JackRabbit?
Apache JackRabbit是一个开放源码的JSR-170 实现,实现了Level 2,但它还有许多扩展的功能。详细可以去它的官方网站