Java垂直爬虫:webmagic 经验

webmagic的发起源于工作中的需要,其定位是帮助开发者更便捷的开发一个垂直的网络爬虫。 webmagic的功能覆盖整个爬虫的生命周期(链接提取、页面下载、内容抽取、持久化),开发者可以便捷的使用xpath和正则表达式进行链接和内容的提取,只需编写少量代码即可完成一个定制爬虫。

jopen 2013-06-13   41583   0

java版结巴分词:jieba-analysis 经验

打星727次(最新的数据以原仓库为准),Fork238次,可以说已经有一定的用户群。 结巴分词(java版)只保留的原项目针对搜索引擎分词的功能(cut_for_index、cut_for_searc

jopen 2013-08-06   123449   0

Java 并发之 CountDownLatch、CyclicBarrier 和 Semaphore 经验

这个场景下就可以使用 CountDownLatch 协调线程之间的调度了。在直接创建线程的年代(Java 5.0 之前),我们可以使用 Thread.join() 。在 JUC 出现后,因为线程池中的线程不能直接被引用,所以就必须使用

jopen 2014-03-13   16011   0

Java缓存新标准(javax.cache) 经验

这篇文章探索Java缓存的新标准:javax.cache。 怎么融入到Java生态系统(Java Ecosystem) 这个标准由JSR107所提出,它的作者同样也是标准制定的领导者。JSR107

jopen 2014-06-09   32357   0

Java EE 7 示例项目:javaee7-samples 经验

javaee7-samples 是一个项目用来演示 Java EE 7 各种新特性的示例,有超过 160 个示例程序,包括: batch/batchlet-simple batch/chunk-checkpoint

jopen 2013-09-11   33073   0

基于Java开发的开源OA系统:Lemon OA 经验

Lemon是一款基于Java开发的开源OA。 我们的目标是逐步吸收各种业务需求,最终发展成为能够包含所有功能的工具栈,实现尽量减少编码,只通过配置就完全各种定制需求。 业务介绍 OA - Office

jopen 2013-11-20   272421   0

Java的GUI自动测试工具:Maveryx 经验

Maveryx 是一个自动化的功能和基于GUI的Java应用的回归测试工具。 Maveryx 通过提供一组动态的GUI对象来消除对 GUI 框架的依赖。此功能用于自动识别和管理的变化,同时确保应用程序不足的缺陷能够测试到。

jopen 2013-12-14   16125   0

Java缓存组件:ehcache-jcache 经验

ehcache-jcache 是 ehcache 对 JCache 标准 API (JSR107) 的实现。

jopen 2014-03-26   24257   0

Java网页信息抽取组件:HtmlExtractor 经验

HtmlExtractor是一个Java实现的基于模板的通用的网页结构化信息精准抽取组件,本身并不包含爬虫功能,但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtrac

jopen 2014-08-07   59221   0

非常棒的Java REST服务器栈:Dropwizard 经验

Dropwizard 是一个开源的Java框架,用于开发OPS友好、高性能的基于REST的后端。它是由 Yammer 开发的,来驱动基于JVM的后端。 Dropwizard提供同类最佳的Java库到一个嵌入式应用程序包。它由以下部分组成:

jopen 2014-08-22   31701   0

Java实现截图并保存到本地 经验

1.java实现截图并保存到本地 提供给大家三个方法,也是整理的,都不是很难,大家需要的看看哈 2.原理都相似 --------------------------------------

jopen 2013-03-13   97793   0

Java ArrayList 和 HaspMap 链式添加的实现 经验

1、ArrayList 代理类: package proxy; import java.util.ArrayList; import java.util.Collection; /** * ArrayList 的代理类

jopen 2013-11-14   12681   0

在应用中使用Java数据网格的5个理由 经验

在这篇文章中,我们探讨在应用中使用Java数据网格在内存中缓存Java对象的5大理由。在后面的文章中,我们将探讨一些其他的数据网格功能,超越数据存储,可以彻底改变你的Java体系结构,就像网格计算和事件。

jopen 2014-01-16   17038   0

Java 程序优化的一些最佳实践 经验

主频即翻倍的时代已经过去了,程序员的编程方式发生了彻底的改变。在目前这个多核多处理器的时代,涌现了原生支持多线程的语言(如 Java)以及分布式并行计算框架(如 Hadoop)。 为了使程序充分地利用多核 CPU,简单地实现一个

jopen 2014-04-11   18217   0

Java 代码规则检查工具:Macker 经验

Macker 是一个适用于Java开发人员用来检查架构规则的工具。你可以定制一个适合特定项目架构的规则文件,也可以为您的代码撰写通用的规则说明。 项目主页: http://www.open-open

jopen 2014-09-07   13382   0

2个比较常用的时间Java工具类 经验

求X天后的日期 import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Calendar;

jopen 2013-06-26   37884   0

Java开源的博客程序:B3log Solo 经验

B3log Solo 是款开源的博客程序,不仅可以运行在 GAE、 BAE 上,也可以运行在标准 Servlet 容器上。

jopen 2013-06-24   24334   0

java发送GET/POST请求工具类 经验

import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader;

jopen 2013-07-23   44008   0

java去除文章中的敏感词 经验

做博客或bbs时;文章中经常会有些敏感词要去掉; 以下是一个java实现这个功能的小例题: 两个个文件words.properties和KeyWordFilter.java; 1、words.properties文件是个文本文件;内容如下:

jopen 2013-12-16   21763   0

11款用于优化、分析源代码的Java工具 经验

1. PMD from http://pmd.sourceforge.net/ PMD能够扫描Java 源代码,查找类似以下的潜在问题: 可能的bug——try/catch/finally/switch语句中返回空值。

jopen 2014-01-24   51578   0
1 2 3 4 5 6 7 8 9 10