Cascading - 基于Hadoop的数据管理和分析框架 经验

Cascading是一个应用程序框架,能够帮助开发人员快速开发基于 Apache Hadoop 的 健壮数据分析和数据管理应用程序。 项目主页: http://www.open-open.com

openkk 2012-06-09   26819   0

基于yahoo高性网页优化规则的分析工具 YSlow 经验

YSlow是yahoo美国开发的一个页面评分插件,非常的棒,从中我们可以看出我们页面上的很多不足,并且可以知道我们改怎么却改进和优化。

openkk 2012-05-16   21883   0

Java性能监测和分析 Perf4J 经验

Perf4J 是一个新的开放源码的性能记录,监测和分析库,主要用于企业Java应用程序。与开发者们所熟悉的Java记录框架很相似,如log4j Perf4J的重点功能: 一个简单的秒表计时机制,对timing进行简洁的声明。

openkk 2012-02-25   43896   0

MongoDB数据模型分析脚本 Variety 经验

就很难去了解库里数据的具体结构了。而 Variety 可对collection中存储的数据情况进行分析。 Variety就是一个js脚本,直接使用mongo客户端执行。 项目主页: http://www

openkk 2012-05-17   13127   0

查看并分析Java垃圾回收日志文件的工具:GCViewer 经验

GCViewer是一个小工具,用于可视化查看由Sun / Oracle, IBM, HP 和 BEA Java 虚拟机产生的垃圾收集器的日志。对性能调优很有帮助。

jopen 2013-12-15   70090   0

三大WEB服务器对比分析(apache ,lighttpd,nginx) 经验

Lighttpd是一个具有非常低的内存开销,cpu占用率低,效能好,以及丰富的模块等特点。lighttpd是众多OpenSource轻量级的web server中较为优秀的一个。支持FastCGI, CGI, Auth,输出压缩(output compress), URL重写, Alias等重要功能。 Lighttpd使用fastcgi方式运行php,它会使用很少的PHP进程响应很大的并发量。

jopen 2014-01-24   22141   0

图的处理和统计分析Python模块:graph-tool 经验

graph-tool是一个高效的Python模块,用于数据结构图的处理和统计分析。其核心数据结构和算法都采用C++实现,广泛使用的模板元编程,很大程度上基于Boost Graph库。 项目主页:

jopen 2012-12-11   68703   0

详细分析了Akka、AMQP、函数编程的特点及趋势 经验

15年大型软件系统工程师张天虎(ID:Sky-Tiger) 与我们一起分享自己的研发之路以及对于开发领域新技术的观点看法,详细分析了Akka、 AMQP、函数编程的特点及趋势 等。欢迎大家跟贴分享更多相关的经验与讨论。 童馨:

jeli007 2012-08-22   119319   0

浏览器HTTP分析调试工具收集 经验

本文对常用的web/http分析调试工具进行分析比较。 1. Firebug Net Firebug是Firefox的一个插件,是Web开发必备工具之一,它自带了一个网络调试工具,它可以捕获所有的

jopen 2014-09-05   14534   0

聚类分析中几种算法的比较 经验

将数据库中的对象进行聚类是聚类分析的基本操作,其准则是使属于同一类的个体间距离尽可能小,而不同类个体间距离尽可能大,为了找到效率高、通用性强的聚类方法人们从不同角度提出了近百种聚类方法,典型的有K-m

jopen 2014-09-17   72927   0
算法  

为大数据集提供统计学习分析的Python工具包:PyMVPA 经验

PyMVPA(Multivariate Pattern Analysis in Python)是为大数据集提供统计学习分析的Python工具包,它提供了一个灵活可扩展的框架。它提供的功能有分类、回归、特征选择、数据导入导出、可视化等

jopen 2014-07-29   27589   0

一个交互式的Python分析器:Profiling 经验

分析包是一个交互式的Python分析器。它受Unity 3D分析器启发。这个包提供了以下功能: 剖析统计数据保持架堆栈。 一个交互式TUI分析统计查看器。 进行远程分析的工具。 线程或greenlet感知的CPU定时器。

jopen 2014-09-30   17404   0

MySQL 主从复制与读写分离概念及架构分析 经验

slave不管。 这个功能,是由google为MYSQL引入的。 3.主从复制分析 问题1:master的写操作,slaves被动的进行一样的操作,保持数据一致性,那么slave是否可以主动的进行写操作?

jopen 2014-10-14   408824   0

PHP数据分析 余弦相似度实现 经验

php-数据分析 余弦相似度实现 分析引擎 * 分析向量的元素 必须和基准向量的元素一致,取最大个数,分析向量不足元素以0填补。 * 求出分析向量与基准向量的余弦值 * @author

jopen 2014-09-19   21625   0
PHP   PHP开发  

基于分布式技术的Web分析处理:Spindle 经验

and Parquet技术实现的下一代Web分析处理。 Spindle 是来自Adobe研究院的开源项目,是构建在 Spark 上的Web日志分析查询。通过 Spray 实现的多线程 HTTP

jopen 2014-10-29   11520   0
Spindle  

Spark SQL 初探: 使用大数据分析2000万数据 经验

目录 [−] 安装和配置Spark Spark初试 使用Spark SQL分析数据 去年网上曾放出个2000W的开房记录的数据库, 不知真假。 最近在学习Spark, 所以特意从网上找来数据测试一下,

jopen 2014-12-11   177140   0

Hermes:来自腾讯的实时检索分析平台 经验

实时检索分析平台(Hermes)是腾讯数据平台部为大数据分析业务提供一套实时的、多维的、交互式的查询、统计、分析系统,为各个产品在大数据的统计分析方面提供完整的解决方案,让万级维度、千亿级数据下的秒级统计分析变为现实。

jopen 2014-12-30   38264   0

Kylin:基于Hadoop的开源数据仓库OLAP分析引擎 经验

Kylin是一个开源、分布式的OLAP分析引擎,它由eBay公司开发,并且基于Hadoop提供了SQL接口和OLAP接口,能够支持TB到 PB级别的数据量。OLAP即联机分析处理,它能够帮助分析人员、管理人员或执行人

jopen 2014-12-02   33465   0

Python3.3提取网页并通过正则表达式来分析 经验

用Python3.3来访问页面。并解析出内容是爬虫程序设计的基础,下面就是个例子,函数GetURL用于取得一个页面的源数据。在函数中,python模拟一个浏览器的访问。取得结果可能会包括非unicode的编码。下面方面教大家怎么查编码

p34f 2014-12-30   51355   0

PyToolz:用python做大规模流数据分析 经验

PyToolz:用python做大规模流数据分析。PyToolz是一组实用功能的迭代器,函数和字典的集合。 >>> def stem(word): ... """ Stem word to primitive

jopen 2015-01-17   26306   0
1 2 3 4 5 6 7 8 9 10