Web虫 larbin 经验

larbin是一种开源的网络虫/网络蜘蛛,由法国的年轻人 Sébastien Ailleret独立开发。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。Larbin只是一个虫,也就

jopen 2012-10-13   25366   0

Apache Thrift 坑行 经验

other languages. 什么是坑行 就是趟应用一个新技术时遇到的各种坑. Common pitfalls 用英文的话. 时空座标 既然是 坑, 那就具有一定的攻击性, 所以, 锁定座标很重要

jopen 2015-09-08   15571   0

ajax 虫 Crowbar 经验

Crowbar: 基于Mozilla浏览器的 ajax 虫,还可作为远程浏览器使用,比较有意思。 项目主页: http://www.open-open.com/lib/view/home/1324864120014

jopen 2011-12-25   55220   0

JAVA虫:WebCollector 经验

一个开源的JAVA虫,包含了一套虫的内核一套完整的虫。内核具有很强的扩展性,用户可以在内核基础上开发自己想要的虫。源码中集成了Jsoup,可进行精准的网页解析。 项目主页:

jopen 2014-07-20   30401   0

ReportAnywhere Excel文档导出程序 经验

Excel文档导出程序 ReportAnywhere 是我自己写的一个小程序,这个程序致力于解决OA、MIS、网站、大型集成系统、PDM、Team center、SAP物联网系统的Excel文档导出问题。在

Yangcl 2013-02-02   69318   0
Excel   POI   OA   PDM   Office文档处理  

Linux 下MySQL的导出与导入操作 经验

一,数据库的备份与导入 1),数据库的备份 1.导出整个数据库 mysqldump -u 用户名 -p 数据库名 > 导出的文件名 例:mysqldump -u dbadmin -p

g2md 2015-09-02   10233   0

使用mysqldump导出数据库 经验

一种方式。本文描述了mysqldump的一些重要参数以及给出了相关示例供大家参考。 1、获mysqldump的帮助信息 [root@SZDB ~]# mysqldump --help|more

jopen 2014-11-20   30615   0

php学习之导出Excel 经验

网上有很多利用PHP导出Excel的类库,这里推荐一个功能强大的类库PHPExcel一个简易的导出方法。 一、犀利强大的PHPExcel 官网: http://phpexcel.codeplex

黑灯舞 2014-12-30   13538   0
PHP   PHP开发  

POI导出EXCEL经典实现 经验

web 开发中,有一个经典的功能,就是数据的导入导出。特别是数据的导出,在生产管理或者财务系统中用的非常普遍,因为这些系统经常要做一些报表打印的工作。而数据导出的格式一般是 EXCEL 或者 PDF ,我

jopen 2014-08-21   81785   0

mongoDB 数据库导出与导入 经验

导出数据 mongodump -h IP --port 端口 -u 用户名 -p 密码 -d 数据库 -o 文件存在路径 如果没有用户密码,可以去掉-u-p。 如果导出本机的数据库,可以去掉-h。

jopen 2016-01-13   7526   0

Java利用iText实现Pdf导出 经验

iText是一个开发源代码的项目,你可以使用iText方便的实现PDF的输出。

fmms 2012-03-31   68445   0

Java中导入、导出Excel 经验

样在我们实际的开发中,很多时候需要实现导入、导出Excel的应用。 目前,比较常用的实现Java导入、导出Excel的技术有两种Jakarta POIJava Excel 下面我就分别讲解一

ybny 2015-04-24   1008105   0

Oracle exp/imp 导入导出命令 经验

(1)表方式,将指定表的数据导出/导入。 导出导出一张或几张表: 代码 $ exp user/pwd file=/dir/xxx.dmp log=xxx.log tables=table1

jopen 2015-08-11   8800   0

基于PHPExcel库的EXCEL导入导出 经验

理插件,最近由于工作需要用到了这个插件,完成了一个excel导入导入的功能。现在将主要逻辑整理一下大家分享,有需要的可以参考一下。 下面的事例只是完成了一个excel的上传下载的基本功能,还有一

mww8 2015-06-28   23462   0

MySQL 数据库导出 经验

-ppwd -p pwd 有时分别表示密码或数据库。 1. 数据库导出: mysqldump -uroot -p 数据库名 -h主机地址(IP) > now.sql 2. 表结构导出: mysqldump

fmms 2011-12-09   37061   0

scrapy虫架构介绍初试 经验

Scrapy 是一套基于Twisted的异步处理框架,是纯python实现的虫框架,用户只需要定制开发几个模块就可以轻松的实现一个虫,用来抓取网页内容或者各种图片。下图显示了Scrapy的大体架构,其中包含了scheduler、item

jopen 2013-11-10   57284   0

gecco-spring - geccospring结合使用 经验

gecco-spring geccospring结合使用 Download com.geccocrawler

jopen 2016-01-25   32051   0

基于gevent多线程模型的虫:Vulcan Spider 经验

基于gevent多线程模型,支持WebKit引擎的动态虫框架。 特性 支持gevent多线程两种并行模型 支持Webkit引擎 (dom parse,ajax fetch,etc...) 多个自定义选项设置

jopen 2014-02-07   39101   0

python 高度健壮性虫的异常超时问题 经验

虫这类型程序典型特征是意外多,无法确保每次请求都是稳定的返回统一的结果,要提高健壮性,能对错误数据or超时or程序死锁等都能进行处理,才能确保程序几个月不停止。本项目乃长期维护github: 反反虫开源库

zoohvan 2017-02-14   35500   0

Python虫: 抓取One网页上的每日一话 经验

先说下需求 最近打算搜集点源数据,丰富下生活。嗯,最近看到 One 这个APP蛮好的。每天想你推送一张图一段话。很喜欢,简单不复杂。而我想要把所有的句子都保存下来,又不想要每个页面都去手动查看。因此,就有

278439392 2016-05-04   27668   0
1 2 3 4 5 6 7 8 9 10