P10

  python web开发领域经验 前豆瓣技术总监清风 文档

上怎么做呢?就是写一个 phython脚本算,数据库拿点数一算,差不多就是这样的情况。后来有了hadoop,做技术的人,我认为自我技术纯洁性的事情。就像用phython的公司可能不愿意用Php类似这样

n5em 2015-06-05   1904   0
P9

  云计算及其应用的开源实现研究 文档

Python Microsoft .NET Sun Cloud APIs Linux-img, hadoop Microsoft Azure [15]旨在提供整套的开发、运行、监控的云计算环境,使软件开

zhuzaisan 2012-12-04   641   0
P17

  Zookeeper 入门 文档

http://xulingbo.net。 简介: Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态

mvpzhou 2013-10-08   554   0
P8

  程序员技术提升必读 文档

学习Thrift,二进制的高性能的通讯中间件,支持数据(对象)序列化和多种类型的RPC服务。 学习HadoopHadoop框架中最核心的设计就是:MapReduce和HDFS。MapReduce的思想是由Goo

huzh_68 2011-09-13   489   0
P1

  Hive和Hbase的整合 文档

hbase_table_1(key int, value string) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' WITH SERDEPROPERTIES

bbs_jack 2011-03-22   3702   0
P2

  hive安装与加载数据 文档

确定版本,hive的安装版本必须与本机hadoop的安装版本相同,要知道hive的安装版本可以登录: https://ccp.cloudera.com/display/DOC/CDH+Version

xnbw 2016-01-12   304   0
P94

  经典分布式文件系统全介绍 文档

支持修改、写入操作。为了增加数据可恢复性,GoogleFs采用了操作日志和快照技术。 29. Hadoop是一个基于JAVA的支持数据密集型分布式应用的分布式文件系统。不仅仅是一个用于存储的分布式文件

zhufugui 2012-09-16   6784   0
P2

  Hbase列式存储特性 文档

tuple 的方式来变相解决。 下面3副图是Hbase的架构、数据模型和一个表格例子,你也可以从:Hadoop summit 上 获取更多的信息。

boycott2 2011-05-17   680   0
P9

  Ganglia简介 文档

6. 监控内容内置 CPU负荷 网络流量 磁盘I/O,使用率 内存使用情况 应用程序内置,比如hadoop&hbase Jvm gc事件 MapReduce Task数量 HDFS 使用情况 7. Ganglie

yinzi_1224 2014-08-14   2759   0
P89

  架构变革-云计算的架构 文档

数据-关系型数据库、NoSQL etc 应用运行支撑-J2EE应用服务器、MQ、ESB、WorkFlow 、Hadoop、Web服务器 etc 应用-核心支撑应用(统一用户管理中心、数据开发平台、监控),各种业务应用

sunjianing 2012-03-26   4444   0
软件架构   方案   Apache   Go   Basic  
P4

  云计算相关功能列表 文档

置,本身也就是一套应用系统,最重要的就是高并发时的性能及负载的划分) 3.分布式计算平台(基于Hadoop) 功能项 说明 必要程度 控制节点 中心任务管理分发处理的控制服务 数据节点 任务处理结点,根据任务程序处理对应的数据并产生结果

cmmjava 2012-04-28   4410   0
P33

  淘宝海量数据产品技术架构 文档

架构总览主站备库RAC主站日志数据源MyFOXProm存储 层数据中间层 / glider查询 层数据魔方淘宝指数开放API产品Hadoop集群 / 云梯计算层实时流数据DataX / DbSync / TimeTunnel1500节点,每日40000

lanxue1939 2013-06-13   7663   0
软件架构   HTTP   JSON   SQL  
P35

  Apache Kylin Extreme OLAP Engine for Big Data 文档

interface and multi-dimensional analysis (OLAP) on Hadoop supporting extremely large datasetsOpen Sourced

lufeng76 2016-01-28   2682   0
P22

  大数据应用 - 数据安全和数据分析 文档

所有离开TCB边界的数据均加密(输入、输出以及中间结果) 保证的数据的机密性和一致性 11. 案例1:Hadoop 改造使用单独的可信虚机(VM2)将用户的计算与其他组件隔离 使用剪裁过的JAR包以减小TCB

cpp45 2015-01-18   627   0
P2

  基于数据中心的海量化物联信息存储与保护 文档

存储技术的工业应用有Google的GFS(Google File System)和Hadoop的HDFS(Hadoop Distributed File System),学术界更是有很多的学者设计实现

tiony 2011-06-27   2759   0
报告   Scala   Go  
P33

  淘宝海量数据产品技术架构 文档

架构总览主站备库RAC主站日志数据源MyFOXProm存储 层数据中间层 / glider查询 层数据魔方淘宝指数开放API产品Hadoop集群 / 云梯计算层实时流数据DataX / DbSync / TimeTunnel1500节点,每日40000

gonow86 2013-01-30   5210   0
软件架构   HTTP   JSON   SQL  
P40

  Jstorm 介绍 文档

Feng)Alibaba 5. Jstorm 是什么Jstorm 是一个分布式实时计算引擎 类似Hadoop MR 用户按照规定的编程规范实现一个任务,将任务放到Jstorm上,Jstorm就将任务7 *

zts2014 2014-10-16   471   0
P21

  搜索和大数据 文档

网页,图片,视频,应用,声音,文本,结构化,半结构化,多媒体,微博,微信,feed Velocity UGC,邮件,贴子,Hadoop,Storm,Spark Value 搜索的价值,日志分析,用户行为,阅读习惯,流感 5. 大

uiu33 2014-09-13   3294   0
P13

  Big Data 大数据 文档

校: 专 业:应用数学 计算机应用方向 E-mail: 2. Agenda1、什么是大数据? 2、Hadoop 3、金融服务业大数据案例 4、思考 3. How big is the Big Data? 4

suntiezhu 2014-02-21   584   0
报告   Apache   SQL   Go  
P5

  分布式采集系统总体设计方案 文档

第一篇 系统总体设计 1 系统流程图 2 系统体系结构 3 体系结构概述 分布式采集系统是建立在hadoop分布式文件系统和zookeeper分布式协调系统基础之上的,所有的数据都存储在分布式文件系统h

gonow86 2013-01-30   7894   0
1 2 3 4 5 6 7 8 9 10