开源项目,开源代码,开源文档,开源新闻,开源社区

Avro是Hadoop中的一个子项目，也是Apache中一个独立的项目，Avro是一个基于二进制数据传输高性能的中间件。在Hadoop的其他项目中例如HBase和Hive的Client端与服务端的数据

码头工人 2019-01-17 831 0

Apache项目

System）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库

码头工人 2019-01-17 1180 0

NoSQL数据库

其功能变得更加强大。Storm类似于另一个开源数据操作平台 Hadoop，Storm也可能成为一项重要业务。据悉，雅虎正在考虑将Hadoop分拆以打造一个规模高达数十亿美元的业务。（凯文）

fmms 2011-08-05 14404 0

Twitter

Oracle公司也就不再会去修改，这对用户来说就是不好的消息。在前几天发布的Hadoop 2.7.0 （《Hadoop 2.7.0发布：不适用于生产和不支持JDK1.6》）中的一个重要的更新就是也不再支持JDK1

bgn4 2015-05-05 15551 0

Spark

NET API for Hadoop WebClient .NET Compiler Platform ("Roslyn") .NET Map Reduce API for Hadoop .NET Micro

jopen 2014-04-04 7302 0

微软

37.html 2 http://dongxicheng.org/data-mining/hadoop-sampling/ 3 http://blog.csdn.net/xiejava/article/month/2011/05

cnzebra 2013-06-27 550 0

Phake Evince

种技术将成为最终的赢者。现在我必须向大家坦白， Hadoop 曾经存在很严重的问题。让我们来看看 2012 年前后的 Hadoop 。 Hadoop 是一个真正的三层堆栈。位于底层的是文件系统 HDFS

jopen 2016-01-04 35285 0

大数据 SQL

P19

getEdit()); } SequenceFile.Writer 4.append 最终是调用hadoop的SequenceFile.Writer.append将数据持久化的。当Region的memstore

de521 2014-08-09 2131 0

NoSQL数据库

Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2016-02-16 44369 0

Apache Hive

pache Hadoop来说，如果没有……等一下，现在谁在负责Hadoop？这个问题的答案就是社区，因为虽然Apache是由Doug Cutting创立，但如今的Apache Hadoop已经成为一个由企业和个人共同维护的开源社区了。

jopen 2014-05-19 5239 0

开源

org.apache.hadoop.hive.serde2.io.HiveVarcharWritable cannot be cast to org.apache.hadoop.hive.common

jopen 2015-02-06 14377 0

Hive

他们会考虑“我需要支持 Hadoop 么？”而不是想“我需要支持 Cloudera 版本，Hortonworks 版本还是其他新发布的 ODP？” 目前，不收费的 Hadoop 版本主要有三个：Apa

jopen 2015-03-12 6051 0

开源项目

10 年，催生了诸多重要软件的诞生。这些白皮书中的两个便促成开源分布式数据系统 Hadoop 的诞生。Hadoop 是大数据革命的基础，现在正被包括 Facebook 以及其他金融服务巨头在内的公司所广泛采用。

jopen 2015-06-04 7335 0

Spanner

定义业务，并方便的在节点中分发；通过worker数目的变化，可以调整其处理能力。如果辅以Hadoop等大数据存储平台及Redis缓存，加以使用zookeeper构成的分布式锁，已经基本可以构建一套即时的可扩展的大数据处理平台。

jopen 2015-07-24 11808 0

Storm

据雷锋网 (公众号：雷锋网) 了解，一个相似的趋势在 Apache Spark 和 Hadoop 之间上演。受调查者对 Hadoop 的兴趣（34.8%），远远少于对 Spark 的 53.3%。这部分

jopen 2017-04-01 16512 0

PostgreSQL

年最终要的两个 IT 预算项目是什么？云计算和大数据！而开源软件是云计算和大数据潮流最重要的驱动力，例如 Hadoop、Pig、Linux 或 OpenStack。虽然开源软件已经开始占领数据中心，但开源最具统治力的领域是云计算。Red

jopen 2012-05-30 14850 0

MySQL

是一个开源的、大数据处理系统，与其他大数据解决方案的不同之处在于它的处理方式。Hadoop 在本质上是一个批处理系统。数据被引入 Hadoop 文件系统 (HDFS) 并分发到各个节点进行处理。当处理完成时，结果数据返回到

jopen 2015-07-14 19156 0

Storm 分布式/云计算/大数据

处理）。关于Flume集群的Agent部署，这里就不多做赘述了，不清楚的同学可以参考《高可用Hadoop平台－Flume NG实战图解篇》一文中的介绍，下面给大家介绍数据来源的流程图，如下图所示：

jopen 2015-07-02 511068 0

Kafka 消息系统

程来处理流式或者批量处理任务，例如Hadoop和Storm，从而提高重用性。当有人问起该如何处理大数据问题时，他们总是被指引到现存的产品中，例如Hadoop或者Storm。虽然这些产品非常棒

jopen 2015-09-24 9007 0

分布式分布式/云计算/大数据

elastic/elasticsearch-hadoop - Elasticsearch real-time search and analytics natively integrated with Hadoop (and Hive)

lmqa7365 2016-02-16 24267 0

ElasticSearch 搜索引擎 Elastic Search

数据序列化框架Apache Avro 开源项目

HBase 开源项目

Twitter开放实时数据处理平台Storm源代码资讯

Spark 1.5将不再支持Java 6 资讯

微软宣布成立.NET基金会全面支持开源项目资讯

有用地地址博客

大数据教父Micheal Stonebraker告诉你大数据的秘密资讯

深入学习Hbase原理资料整理文档

Apache Hive 2.0.0 发布，数据仓库平台资讯

开源领域的个人崇拜正在消失资讯

Hive 1.0.0发布资讯

定义开源项目的三个核心要素资讯

前谷歌员工推出类Spanner数据库项目资讯

一种基于Storm的可扩展即时数据处理架构思考资讯

2017数据库大趋势 PostgreSQL最受关注资讯

MySQL在Web应用领域面临NoSQL的挑战资讯

Storm常见问题及解决方案总结经验

Kafka实战－Flume到Kafka 经验

反思 | 分布式框架是必须的吗？经验

A list of Elasticsearch tutorials, videos, tools and resources 经验

K-means Hadoop 的相关搜索

关键词

数据序列化框架Apache Avro 开源项目

HBase 开源项目

Twitter开放实时数据处理平台Storm源代码 资讯

Spark 1.5将不再支持Java 6 资讯

微软宣布成立.NET基金会全面支持开源项目 资讯

有用地地址 博客

大数据教父Micheal Stonebraker告诉你大数据的秘密 资讯

深入学习Hbase原理资料整理 文档

Apache Hive 2.0.0 发布，数据仓库平台 资讯

开源领域的个人崇拜正在消失 资讯

Hive 1.0.0发布 资讯

定义开源项目的三个核心要素 资讯

前谷歌员工推出类Spanner数据库项目 资讯

一种基于Storm的可扩展即时数据处理架构思考 资讯

2017数据库大趋势 PostgreSQL最受关注 资讯

MySQL在Web应用领域面临NoSQL的挑战 资讯

Storm常见问题及解决方案总结 经验