P40 典型搜索引擎、 搜索引擎分类、 搜索引擎的成功之道、 搜索引擎系统技术原理、 数据库检索与全文检索区别、 打造元器件知识库服务平台、 信息服务平台未来趋势——个性化服务推荐
P34 全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。
P11 什么是发布管理服务?简单来说:就是中间件的部署管理工作,应用部署在weblogic、websphere或者其他开源的中间件,使用应用系统必然离不开中间件;每一次版本的上线,都会带来部署包的传递、执行脚本、部署操作、部署后的验证。如果有一套规范的部署流程管理,会带来很多的好处。
P25 Lucene简介、Lucene工程代码结构、核心Index类介绍、Lucene各种Query 。
P40 Lucene是什么包括:全文索引库。简单的语言解析功能。不包括:爬虫、文档格式解析、“PageRank”等排序算法。
P23 什么是软件质量?满足明确声明的功能和性能需求,明确文档化的开发过程以及专业人员开发的软件所具有的所有隐含特征(软件工程实践者理论)。
P40
P16 提纲CSS定位概述,相对定位,绝对定位,浮动CSS。定位(Positioning)CSS定位和浮动CSS为定位和浮动提供了一些属性,利用这些属性,可以建立列式布局,将布局的一部分与另一部分重叠,还可以完成多年来通常需要使用多个表格才能完成的任务。
P27 Javadb概述,JavaDB是Sun的支持分布的开源ApacheDerby的100%Java技术的数据库。它是完全事务性,安全,易于使用,基于标准的集-SQL,JDBCAPI和JavaEE的-然而小,只有2.5MB的。Derby是一个名为Cloudscape的小公司构思的;当Cloudscape卖给Informix后,该产品得到了加强;当IBM加入时,在“bigblue”期间,它的高端工程特性得到增强;现在已经成为一个有最自由的许可的开源项目而存在。<br> 什么是Java数据库?JavaDB是Sun支持的开源Apache Derby数据库。JavaDB是用Java编写的,提供“一次编写,到处运行”的可移植性。其易用性,标准,完整的功能集,和小型使它成为理想的Java开发数据库。它可以嵌入在Java应用程序,需要由发展商或用户无需管理。它也可以用在客户端服务器模式。JavaDB是完全事务,并提供一个标准的SQL接口以及一个JDBC4.0兼容驱动程序。Apache的Derby项目有一个强大的和不断增长的社会,其中包括如Sun微系统公司和IBM公司以及个人捐助的大公司开发。
P32 了解 XML的体系结构及优势、 理解格式良好且有效的 XML 文档、 学会如何使用 DTD 生成 XML 文档、 理解命名空间。
P16 Annotation 是 JDK 1.5 增加的语言特性,主要为 Java EE 5 发布作为铺垫的,从 Java EE 5 开始使用了大量的 Annotation。比如:EJB3,JPA,JWS 等等都将复杂的 XML 配置文件作为可 选了,由 Annotation 取而代之。 用注释(Annotation)来标识要作绑定的类和属性等,这可以极大简化了开发的工作量。 Annotation 一般可以取代复杂的配置文件,用于告之容器管理者某个类、方法的行为 Annotation(注释)是JDK5.0及以后版本引入的。
P51 整理SQL语句的Coding基准,使开发人员有效执行SQL语句从而提高整体的性能。按各Project的Coding基准,规定SQL语句的编制规则,从Project开发起点适用及管理从而达到持续性管理及稳定。
P39
P85
P41 文本高层次理解的对象可以是仅包含简单句子的单个文本也可以是多个文本组成的文本集,但是现有的技术手段虽然基本上解决了单个句子的分析问题,但是还很难覆盖所有的语言现象,特别是对整个段落或篇章的理解还无从下手。 将数据挖掘的成果用于分析以自然语言描述的文本,这种方法被称为文本挖掘(Text Mining)或文本知识发现(Knowledge Discovery in Text).
P87 数据挖掘是从存放在数据集中的大量数据挖掘出有趣知识的过程。 (2)数据挖掘,又称为数据库中知识发现(Knowledge Discovery in Databases)或知识发现,它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的非平凡过程,它与数据仓库有着密切的联系。 (3)广义的数据挖掘是指知识发现的全过程;狭义的数据挖掘是指统计分析、机器学习等发现数据模式的智能方法,即偏重于模型和算法。 (4)数据库查询系统和专家系统不是数据挖掘!在小规模数据上的统计分析和机器学习过程也不应算作数据挖掘。
P31 服务器虚拟化的基础概念:什么是服务器虚拟化? 就是将物理服务器、操作系统、及其应用程序 “打包”为一个或多个文件-可移动的虚拟机(VM)。
P49 JBPM4工作流介绍。流程整合的模型,已经超越了“流程运转模型”的概念范畴。但是作为目前“系统整合”的一个比较流行的趋势,拿到这里顺便提一下。现在的业务越来越复杂,跨区域,跨部门之间信息交互方式的需要越来越明显,而且跨区域,跨部门之间业务配合也越来越多。从信息整合的发展来看,“面向应用的数据层整合”和“面向服务的接口层整合”都逐渐走向“BMP”模式:由中央主流程控制多个子流程(分布在不同地域或不同部门,各自独立的流程)协同运行,以达到整个业务逻辑的运行。 其实在第二章“流程的激活模型”的“外界消息激活”模型中,我已经简单提到了一些,只是不太明确。那么现在让我们来看看一个普通的“流程整合”大概是什么样子的,请参看下图。 实际的整合要比这张图上的复杂很多,也许还会有一些JMS/WebService 等的信息交换接口,可能用到不同厂家的数据交换平台,或消息中间件等等;当然那些安全措施也必不可少了。 简单的整合模型,基本上都是采用“主流程控制”的方式:由一个主流程控制整个流程的运行,由各个子流程具体完成某项任务,并向主流程返回处理结果。主流程在确定子流程正确运行/处理完后,并得到处理完的信息后,会继续按照预定的流程路线,激活另一个子流程。
P14 PHP(PHP: Hypertext Preprocessor,超文本预处理器的字母缩写)是一种被广泛应用的开放源代码的多用途脚本语言,它可嵌入到 HTML中,尤其适合 WEB 开发。
P20