分布式消息系统:Kafka 经验

c里。那么这些结果被订阅者拿到后,就可以做进一步的实时处理,或实时监控,或放到hadoop/离线数据仓库里处理。 3.元信息监控 作为操作记录的监控模块来使用,即汇集记录一些操作信息,可以理解为运维性质的数据监控吧。

jopen 2014-12-03   34316   0

用户事件的存储与分析 经验

存储这类数据的方法一般可以分为三类 传统关系型数据库,如MySQL, PostgreSQL Hadoop HDFS + Hive 数据仓库,如Amazon Redshift, Microsoft SQL Server for PDW

jopen 2014-12-17   18144   0
存储  
P6

  大数据架构师基础:hadoop家族,Cloudera产品系列等各种技术 文档

手把手交你写Mapreduce程序实例并部署在Hadoop2.2.0上运行 Hive: Apache Hive是Hadoop的一个数据仓库系统,促进了数据的综述(将结构化的数据文件映射为一张数据库表)、即席查询以及存储在Hadoop兼容系统中的大

tony2007 2015-06-19   2795   0

PHP操作MongoDB学习 经验

l 传统的商业智能应用:针对特定问题的BI数据库会对产生高度优化的查询方式。对于此类应用,数据仓库可能是更合适的选择。 l 需要SQL的问题 MongoDB支持OS X、Linux及Wi

fmms 2012-01-03   133959   0

技术普及帖:你刚才在淘宝上买了一件东西 博客

PB(1PB=1024TB=1048576GB)。如此巨大的数据量经过淘宝系统1:120的极限压缩存储在淘宝的数据仓库中。并且通过一个叫做云梯 的,由2000多台服务器组成的超大规模数据系统不断的进行分析和挖掘。

openkk 2012-02-26   1565   0
P48

  8处理数据 文档

如果满足条件的行存在,执行更新操作;否则执行插入操作: 避免多次重复执行插入和删除操作 提高效率而且使用方便 在数据仓库应用中经常使用 29. 合并语句的语法可以使用merge语句,根据指定的条件进行插入或更新操作MERGE

csdnyyqq 2017-03-08   723   0
SQL  
P41

  MongoDB 资料分享 文档

序。 2.传统的商业智能应用:针对特定问题的BI数据库会对产生高度优化的查询方式。对于此类应用,数据仓库可能是更合适的选择。 8. 8MongoDB简介 谁在使用? 9. 9MongoDB操作 安装 wget

renshifa 2013-08-03   7291   0
NoSQL数据库   C#   x86   C/C++   ErLang  
P35

  Hadoop及mapreduce入门 文档

node test cluster 5. Hadoop-related projectsHive:数据仓库,facebook贡献 PIG:并行计算的一种高级语言,yahoo贡献 Nutch:网页搜索软件,不只是爬虫

P37

  大数据架构 文档

数据挖掘offer repostnew offerbid 行为数据的采集 追踪埋点 异步收集 采集数据的分析 数据仓库 分析引擎 运营团队决策 风险行为的控制 CTU系统 安全团队 24. 网站产品的生命周期产品需

WillZhao 2018-01-02   1549   0
P17

  如何让SQL在Spark上运行的更快 文档

lodesk上的列式数据。兼容ANSI SQL 1999, HiveQL和PL/SQL语法,支持数据仓库、数据集市等分析系统中常用的复杂分析型语法,方便应用迁移。 统计库 并行化的高性能统计算法库,用

nn34 2014-12-16   6216   0

Kafka设计解析(五):Kafka Benchmark 经验

郭俊(Jason),硕士,从事大数据平台研发工作,精通Kafka等分布式消息系统,Storm等流式处理系统及数据仓库性能调优。 个人博客: http://www.jasongj.com 新浪微博:郭俊_Jason

jopen 2016-01-06   13470   0

你应该知道的大数据领域12大动向 经验

Cloud和亚马逊Redshift中的数据集成任务之间的安全套接层通信。 Teradata发布支持Presto的技术 企业数据仓库开发商Teradata发布了技术,支持它所发行的来自许多大数据分析软件开发商的Presto SQL-on-Hadoop软件。

axcu9192 2016-07-05   27761   0

Kudu:支持快速分析的新型Hadoop存储系统 经验

SequenceFile , Hbase 和 Parquet 。 在使用 Kudu 以后, Kudu 作为统一的数据仓库,可以同时支持离线分析和实时交互分析。 性能测试 1. 和 parquet 的比较

分布式消息系统 Kafka 简介 经验

c里。那么这些结果被订阅者拿到后,就可以做进一步的实时处理,或实时监控,或放到hadoop/离线数据仓库里处理。 6.3 元信息监控 作为操作记录的监控模块来使用,即汇集记录一些操作信息,可以理解为运维性质的数据监控吧。

jopen 2014-08-19   61665   0

登月1号:支付宝演绎空中升级绝技 经验

等多部门组成的技术团队正式启动支付宝升级。”原有基于Hadoop集群的应用,涵盖了原始数据采集,数据仓库应用,数据挖掘以及将数据回馈到前端应用等各个环节,共有超过1万个Hive SQL、MapRedu

jopen 2014-10-30   22579   0

Spark SQL 初探: 使用大数据分析2000万数据 经验

的1/10或者1/100的长度。Shark类似“SQL on Spark”,是一个在Spark上数据仓库的实现,在兼容Hive的情况下,性能最高可以达到Hive的一百倍。 Apache Spark

jopen 2014-12-11   177140   0
P10

  j2ee面试知识 文档

答:JDO是Java对象持久化的新的规范,为java data object的简称,也是一个用于存取某种数据仓库中的对象的标准化API。JDO提供了透明的对象存储,因此对开发人员来说,存储数据对象完全不需要额外的代码(如JDBC

曾昭强 2017-12-01   1045   0
J2EE   Java开发   HTML   Java   SQL  
P27

  TestDirector8.0 后台管理员使用手册 文档

rector能消除组织机构间、地域间的障碍。它能让测试人员、开放人员或其它的IT人员通过一个中央数据仓库,在不同位置就能互通测试信息。 使用测试管理工具的好处: 1) 支持并规范软件测试全过程;将测试需求分析、测试用例设计、测试实施

ccm1314ztt 2012-11-18   669   0

Facebook开源大规模预测工具Prophet:支持Python和R 经验

以很容易地并行化,而预测本身也能容易地被存储在 MySQL 这样的关系数据库或 Hive 这样的数据仓库中。据我们观察,「规模」在实践中面临的问题涉及的是由多种预测问题所引入的复杂性(complexi

PhiEichmann 2017-02-24   61120   0
Python   开源  

微软数据库拥抱Hadoop 资讯

(HBase 和 Avro 已经于2010年5月成为顶级 Apache 项目[1]) Hive:数据仓库工具,由Facebook贡献。 Zookeeper:分布式锁设施,提供类似Google Chubby的功能,由Facebook贡献。

jopen 2011-10-14   30596   2
Hadoop  
1 2 3 4 5 6 7 8 9 10