数据序列化框架Apache Avro 开源项目

Avro是Hadoop中的一个子项目,也是Apache中一个独立的项目,Avro是一个基于二进制数据传输高性能的中间件。在Hadoop的其他项目中例如HBase和Hive的Client端与服务端的数据

码头工人 2019-01-17   831   0

HBase 开源项目

System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库

码头工人 2019-01-17   1180   0

Twitter开放实时数据处理平台Storm源代码 资讯

其功能变得更加强大。Storm类似于另一个开源数据操作平台 Hadoop,Storm也可能成为一项重要业务。据悉,雅虎正在考虑将Hadoop分拆以打造一个规模高达数十亿美元的业务。(凯文)

fmms 2011-08-05   14404   0
Twitter  

Spark 1.5将不再支持Java 6 资讯

Oracle公司也就不再会去修改,这对用户来说就是不好的消息。 在前几天发布的Hadoop 2.7.0 ( 《Hadoop 2.7.0发布:不适用于生产和不支持JDK1.6》 )中的一个重要的更新就是也不再支持JDK1

bgn4 2015-05-05   15551   0
Spark  

微软宣布成立.NET基金会全面支持开源项目 资讯

NET API for Hadoop WebClient .NET Compiler Platform ("Roslyn") .NET Map Reduce API for Hadoop .NET Micro

jopen 2014-04-04   7302   0
微软  

有用地地址 博客

37.html 2 http://dongxicheng.org/data-mining/hadoop-sampling/ 3 http://blog.csdn.net/xiejava/article/month/2011/05

cnzebra 2013-06-27   550   0
Phake   Evince  

大数据教父Micheal Stonebraker告诉你大数据的秘密 资讯

种技术将成为最终的赢者。现在我必须向大家坦白, Hadoop 曾经存在很严重的问题。让我们来看看 2012 年前后的 HadoopHadoop 是一个真正的三层堆栈。位于底层的是文件系统 HDFS

jopen 2016-01-04   35285   0
大数据   SQL  
P19

  深入学习Hbase原理资料整理 文档

getEdit()); } SequenceFile.Writer 4.append 最终是调用hadoop的SequenceFile.Writer.append将数据持久化的。 当Region的memstore

de521 2014-08-09   2131   0

Apache Hive 2.0.0 发布,数据仓库平台 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2016-02-16   44369   0

开源领域的个人崇拜正在消失 资讯

pache Hadoop来说,如果没有……等一下,现在谁在负责Hadoop?这个问题的答案就是社区,因为虽然Apache是由Doug Cutting创立,但如今的Apache Hadoop已经成为一个由企业和个人共同维护的开源社区了。

jopen 2014-05-19   5239   0
开源  

Hive 1.0.0发布 资讯

org.apache.hadoop.hive.serde2.io.HiveVarcharWritable cannot be cast to org.apache.hadoop.hive.common

jopen 2015-02-06   14377   0
Hive  

定义开源项目的三个核心要素 资讯

他们会考虑“我需要支持 Hadoop 么?”而不是想“我需要支持 Cloudera 版本,Hortonworks 版本还是其他新发布的 ODP?” 目前,不收费的 Hadoop 版本主要有三个:Apa

jopen 2015-03-12   6051   0

前谷歌员工推出类Spanner数据库项目 资讯

10 年,催生了诸多重要软件的诞生。 这些白皮书中的两个便促成开源分布式数据系统 Hadoop 的诞生。Hadoop 是大数据革命的基础,现在正被包括 Facebook 以及其他金融服务巨头在内的公司所广泛采用。

jopen 2015-06-04   7335   0
Spanner  

一种基于Storm的可扩展即时数据处理架构思考 资讯

定义业务,并方便的在节点中分发;通过worker数目的变化,可以调整其处理能力。 如果辅以Hadoop等大数据存储平台及Redis缓存,加以使用zookeeper构成的分布式锁,已经基本可以构建一套即时的可扩展的大数据处理平台。

jopen 2015-07-24   11808   0
Storm  

2017数据库大趋势 PostgreSQL最受关注 资讯

据雷锋网 (公众号:雷锋网) 了解,一个相似的趋势在 Apache Spark 和 Hadoop 之间上演。受调查者对 Hadoop 的兴趣(34.8%),远远少于对 Spark 的 53.3%。 这部分

jopen 2017-04-01   16512   0

MySQL在Web应用领域面临NoSQL的挑战 资讯

年最终要的两个 IT 预算项目是什么?云计算和大数据!而开源软件是云计算和大数据潮流最重要的驱动力,例如 Hadoop、Pig、Linux 或 OpenStack。 虽然开源软件已经开始占领数据中心,但开源最具统治力的领域是云计算。Red

jopen 2012-05-30   14850   0
MySQL  

Storm常见问题及解决方案总结 经验

是一个开源的、大数据处理系统,与其他大数据解决方案的不同之处在于它的处理方式。Hadoop 在本质上是一个批处理系统。数据被引入 Hadoop 文件系统 (HDFS) 并分发到各个节点进行处理。当处理完成时,结果数据返回到

jopen 2015-07-14   19156   0

Kafka实战-Flume到Kafka 经验

处理)。关于Flume集群的Agent部署,这里就不多做赘述了,不清楚的同学可以参考《 高可用Hadoop平台-Flume NG实战图解篇 》一文中的介绍,下面给大家介绍数据来源的流程图,如下图所示:

jopen 2015-07-02   511068   0

反思 | 分布式框架是必须的吗? 经验

程来处理流式或者批量处理任务,例如Hadoop和Storm,从而提高重用性。 当有人问起该如何处理大数据问题时,他们总是被指引到现存的产品中,例如Hadoop或者Storm。虽然这些产品非常棒

jopen 2015-09-24   9007   0

A list of Elasticsearch tutorials, videos, tools and resources 经验

elastic/elasticsearch-hadoop - Elasticsearch real-time search and analytics natively integrated with Hadoop (and Hive)

lmqa7365 2016-02-16   24267   0
1 2 3 4 5 6 7 8 9 10