基于分布式技术的Web分析处理:Spindle 经验

and Parquet技术实现的下一代Web分析处理。 Spindle 是来自Adobe研究院的开源项目,是构建在 Spark 上的Web日志分析查询。通过 Spray 实现的多线程 HTTP

jopen 2014-10-29   11520   0
Spindle  

Spark SQL 初探: 使用大数据分析2000万数据 经验

目录 [−] 安装和配置Spark Spark初试 使用Spark SQL分析数据 去年网上曾放出个2000W的开房记录的数据库, 不知真假。 最近在学习Spark, 所以特意从网上找来数据测试一下,

jopen 2014-12-11   177140   0

Hermes:来自腾讯的实时检索分析平台 经验

实时检索分析平台(Hermes)是腾讯数据平台部为大数据分析业务提供一套实时的、多维的、交互式的查询、统计、分析系统,为各个产品在大数据的统计分析方面提供完整的解决方案,让万级维度、千亿级数据下的秒级统计分析变为现实。

jopen 2014-12-30   38264   0

Kylin:基于Hadoop的开源数据仓库OLAP分析引擎 经验

Kylin是一个开源、分布式的OLAP分析引擎,它由eBay公司开发,并且基于Hadoop提供了SQL接口和OLAP接口,能够支持TB到 PB级别的数据量。OLAP即联机分析处理,它能够帮助分析人员、管理人员或执行人

jopen 2014-12-02   33465   0

Python3.3提取网页并通过正则表达式来分析 经验

用Python3.3来访问页面。并解析出内容是爬虫程序设计的基础,下面就是个例子,函数GetURL用于取得一个页面的源数据。在函数中,python模拟一个浏览器的访问。取得结果可能会包括非unicode的编码。下面方面教大家怎么查编码

p34f 2014-12-30   51355   0

PyToolz:用python做大规模流数据分析 经验

PyToolz:用python做大规模流数据分析。PyToolz是一组实用功能的迭代器,函数和字典的集合。 >>> def stem(word): ... """ Stem word to primitive

jopen 2015-01-17   26306   0

Spark on Mesos: 粗粒度与细粒度实现分析 经验

顺着昨天spark standalone实现那篇文章继续扯淡,看看Mesos Scheduler的两种实现的异同。 对我来说,回过头再仔细看Spark在这一层的实现,思路又清晰了许多。

jopen 2015-02-13   20915   0

大规模并行 SQL 分析处理引擎:HAWQ 经验

HAWQ 是 Pivotal 设计的一个大规模并行 SQL 分析处理引擎,支持事务处理。HAWQ 将复杂的查询分割成简单的任何,并分发到并行处理系统中的处理单元执行。包括查询规划器、动态管道、前沿互联

jopen 2015-02-18   67163   0
HAWQ   SQL  

一个Ruby静态代码分析器:rubocop 经验

这是一个Ruby静态代码分析器,基于社区Ruby编码风格指南 Ruby Style Guide 。除了报告代码中的问题,RuboCop还可以自动为你修复一些问题。 安装 RuboCop 的安装是非常标准:

jopen 2015-03-08   48959   0

JAVA IO 设计模式彻底分析 经验

无论是哪种编程语言,输入跟输出都是重要的一部分,Java也不例外,而且Java将输入/输出的功能和使用范畴做了很大的扩充。它采用了流的 机制来实现输入/输出,所谓流,就是数据的有序排列,而流可以是从某个源(称为流源或Source of Stream)出来,到某个目的地(称为流汇或Sink of Stream)去的。由流的方向,可以分成输入流和输出流,一个程序从输入流读取数据向输出流写数据。

f663x 2015-03-13   22836   0
P7

  学生信息管理系统需求分析说明书 文档

学生信息管理系统 需求分析说明书 学生信息管理系统 需求分析说明书 学院: 计算机与信息工程学院 班级:计算机4班 姓名:尚俊超 学号:09509121 第 页 共7页 学生信息管理系统 需求分析说明书 目录 1

非轻云淡 2012-05-29   8992   0
P21

  药店管理系统分析和设计UML 文档

 《面向对象分析与设计(UML)》 课程设计报告 设计题目: 药店管理系统 院 系: 计算机科学与工程学院 专 业: 软件工程(嵌入式) 班  级: Y122092 学 号: 姓 名: 指导教师: 设计地点:

likui007 2014-05-12   5490   0
P6

  ArcEngine 最短路径分析(C#源码) 文档

ArcEngine 最短路径分析(源码) using System; using ESRI.ArcGIS.Carto; using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS

zpmaster 2013-04-21   958   0
P8

  Google Dremel 原理-如何能3秒分析1PB 文档

如何能 3 秒分析 1PB 楼主  发表于 2012-11-29 20:30:39 | 查看: 246| 回复: 20 分享到: 简介 Dremel 是Google 的“交互式”数据分析系统。可以组建

beijixing022 2013-12-12   363   0
Go  
P9

  SSH Web开发架构分析和实现 文档

SSH Web开发架构分析和实现   大型企业级Web应用系统的开发通常要求有一个良好的软件架构、便于协作开发和扩展升级,而传统的开发模式不能很好地满足这些要求。本文对当前Web应用程序开发面临的问

jelly0812 2012-01-01   8187   0
P24

  区域综合分析平台技术方案 文档

区域综合分析平台技术方案 目录 第1章 概述 3 1.1 平台概述 3 1.2 平台建设任务 4 1.3 平台建设目标 4 第2章 平台总体设计 4 2.1 设计原则 4 2.2 技术路线选择 5 2

114046323 2013-06-03   1714   0
方案  
P15

  当前流行的J2EE WEB应用架构分析 文档

当前流行的J2EE WEB应用架构分析 1. 架构概述 J2EE体系包括java server pages(JSP) ,java SERVLET, enterprise bean,WEB servi

hxaplx 2012-03-08   4751   0
P16

  ESB项目需求分析和方案设计浅谈 文档

如同其它IT项目一样,企业服务总线类项目的实施也要经历需求分析、方案设计、编码和测试、上线部署等阶段。下面我们将针对ESB项目的设计和实施过程中各个阶段要完成的主要工作内容和一些最佳实践跟大家作一些

P3

  nginx负载均衡和lvs负载均衡的比较分析 文档

nginx负载均衡和lvs负载均衡的比较分析 lvs和nginx都可以用作多机负载的方案,它们各有优缺,在生产环境中需要好好分析实际情况并加以利用。 首先提醒,做技术切不可人云亦云,我云即你云;同

benevolenc 2013-12-19   564   0

使用python中的matplotlib进行绘图分析数据 代码段

,只需要在这个页面中浏览/复制/粘贴一下,基本上都能搞定。 在Linux下比较著名的数据图工具还有gnuplot,这个是免费的,Python有一个包可以调用gnuplot,但是语法比较不习惯,而且画图质量不高。

lsssw12313 2015-05-17   2266   0
1 2 3 4 5 6 7 8 9 10