开源项目,开源代码,开源文档,开源新闻,开源社区

往往是你的最佳选择。 Hadoop 和 Hive 一群基于 Java 的工具被开发出来以满足数据处理的巨大需求。Hadoop 作为首选的基于 Java 的框架用于批处理数据已经点燃了大家的热情。Hadoop 比其

vctx3545 2016-05-24 49304 0

大数据编程语言分布式/云计算/大数据

P29

阿里云（云计算服务团队）淘宝/一淘（网页抓取团队）技术方向：搜索离线系统2 3. 提纲搜索离线系统技术体系 Hadoop-2.0 YARN介绍 Stream Service 计算模型 Stream Service 服务调度

defeqw 2015-11-30 546 0

搜索引擎 SQL

起具有指导性的知识系统。问：很多人认为Spark会凭借优秀的性能推翻Hadoop的统治，你同意吗？大数据处理技术（如Hadoop, Pig, Tez, Hive，以及Spark）的生态系统在未来将会怎样？

jopen 2016-02-16 10850 0

大数据数据分析 Spark SQL

8）Apache Hadoop 大数据和自动化是 2018 年许多公司关注的重点，这就是为什么学习 Hadoop 和 Spark 等大数据技术变得至关重要。Apache Hadoop 是一个允许使用

jopen 2018-02-04 25237 0

Java web 移动开发

建立Profile以实现实时智能实时地保护Hadoop生态系统中大数据的安全。 Eagle的数据行为监控方案可用于如下几类典型场景：监控Hadoop中的数据访问流量检测非法入侵和违反安全规则的行为

jopen 2016-07-21 27380 1

eBay Hadoop Apache Eagle

最佳选择。 Hadoop和Hive 一群基于Java的工具被开发出来以满足数据处理的巨大需求。Hadoop作为首选的基于Java的框架用于批处理数据已经点燃了大家的热情。Hadoop比其他一些处理

NoahBlanks 2017-07-26 29507 0

大数据 R语言 Python Java Kafka

很多人持这种观点，中国人，技术都是差的，也是写不出hadoop的，挣钱最重要，但自己又觉得自己很厉害。其实将写出hadoop和挣钱作为标准，这个观点本身就太局限了，人这辈子，钱当然重要，写出能用的hadoop还是写出mini

jopen 2015-06-19 8790 0

程序员

Spark 是目前相当火热的开源计算框架，相对于 Hadoop ，Spark优势是高性能和易用性。Spark的高性能源于其采用内存储存数据，应用可以以内存的速度进行运算；Spark的易用性在于通用的A

jopen 2015-08-01 23892 0

Spark

com/archives/1260 * 过往记忆博客，专注于hadoop、hive、spark、shark、flume的技术博客，大量的干货 * 过往记忆博客微信公共帐号：iteblog_hadoop */ SELECT v1.name

jopen 2015-02-04 71241 0

Spark SQL 分布式/云计算/大数据

在 OpenStack 之前，这几年被人们谈论最多的开源项目应该是 Linux 和 Hadoop 。当然 Linux 时间比较长了，对于它一直的茁壮成长，根据我从外界的了解，可能与

jopen 2015-01-06 77300 0

OpenStack 存储系统分布式/云计算/大数据

S独大，也就是Hadoop的底层存储，现在大数据的技术除了微软系的意外，基本都是HDFS作为底层的存储技术。上层的YARN就是MapReduce的第二版，和在一起就是Hadoop最新版本。基于之上的应用有Hive，Pig

jopen 2015-04-03 72981 0

大数据分布式/云计算/大数据

时间跨度等信息 (span) 以 Hadoop 为例，它在 Mongodb中的一条记录为： { "_id" : "1430277742.791925", "prj" : "hadoop-common.git"

jopen 2015-06-25 17561 0

Meteor

，自动实现复杂均衡；支持Hadoop数据并行加载，对于像Hadoop的一样的日志数据和离线分析系统，但又要求实时处理的限制，这是一个可行的解决方案。Kafka通过Hadoop的并行加载机制来统一了在线和离线的消息处理。Apache

jopen 2016-01-10 14844 0

消息系统

scribe会将转存的日志重新传输给中央存储系统。其通常与Hadoop结合使用，scribe用于向HDFS中push日志，而Hadoop通过MapReduce作业进行定期处理。 Scribe支持的特性：

jopen 2014-12-04 20945 0

分布式/云计算/大数据 scribe

分布式系统套件的转换。这是一件令人兴奋的事情：我们构建、部署，而且直到今天仍然在运行的分布式图形数据库、分布式搜索后端、 Hadoop安装以及第一代和第二代键值数据存储。从这一切里我们体会到的最有益的事情是我们构建的许多东

jopen 2014-02-10 98975 0

软件工程师

undergoing incubation are Abdera, Archiva, Cayenne, CXF, Hadoop, Harmony, HiveMind, Jackrabbit, MINA, ODE, OfBIZ

jopen 2014-11-24 28520 0

Apache

便探讨一下SparkSQL和Hive On MapReduce比起来到底有何其别。 SQL On Hadoop的解决方案已经玲琅满目了，不管是元祖级的Hive，Cloudera的Impala，MapR的

jopen 2015-12-08 30888 0

SparkSQL

全量数据处理使用的大多是鼎鼎大名的hadoop或者hive，作为一个批处理系统，hadoop以其吞吐量大、自动容错等优点，在海量数据处理上得到了广泛的使用。但是，hadoop不擅长实时计算，因为它天然就是

jopen 2013-11-04 78329 0

分布式/云计算/大数据 Storm

大数据处理/数据分析/分布式工具 Hadoop：分布式的文件系统，结合其MapReduce编程模型可以用来做海量数据的批处理（Hive，Pig，HBase啥的就不说了），值得介绍的是Cloudera的Hadoop分支CDH5，基于YARN

jopen 2015-11-18 110476 0

Github

ava重写现有的实时处理代码。 Nathan是Hadoop的忠实用户，他相信使用已有的Hadoop知识可以更好地设计Storm。比如，Hadoop会产生“僵尸进程”，这些进程会不断的累积占用资源，

jopen 2015-04-03 33956 0

Storm 分布式/云计算/大数据

K-means Hadoop 的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

Java SQL Python 程序员搜索引擎移动开发 Hadoop Storm Github R语言消息系统 OpenStack 大数据 Kafka 软件工程师 Spark eBay 数据分析 Meteor Apache Eagle SparkSQL Spark SQL 存储系统分布式/云计算/大数据 scribe 编程语言 web Apache

9个最佳的大数据处理编程语言经验

搜索离线生产集群中的流计算文档

图灵访谈： IBM美女工程师Holden Karau：寻找友善的人一起共事资讯

2018年Java，Web和移动程序员学习的12个框架资讯

Apache Eagle v0.4.0发布，一个高效分布式的流式策略引擎资讯

9个最佳的大数据处理编程语言经验

对程序员说点实在话资讯

IBM如何拥抱Spark 资讯

Spark SQL中对Json支持的详细介绍经验

夜话存储：从调侃OpenStack和Ceph谈起经验

部署大数据？请参考大数据分析平台架构(Big Data Analytics Platform) 经验

120行代码实现基于Meteor的即时搜索工具经验

Kafka知识点汇总经验

分布式日志系统：Scribe 经验

每个软件工程师都应该知道的有关实时数据的统一概念经验

Apache软件基金会庆祝15年的开放源码创新和社区的领导地位资讯

一个SparkSQL作业的一生资讯

storm简介经验

GitHub上整理的一些工具经验

Storm是如何成为Apache顶级项目的经验

K-means Hadoop 的相关搜索

关键词

9个最佳的大数据处理编程语言 经验

搜索离线生产集群中的流计算 文档

图灵访谈 ： IBM美女工程师Holden Karau：寻找友善的人一起共事 资讯

2018年Java，Web和移动程序员学习的12个框架 资讯

Apache Eagle v0.4.0发布，一个高效分布式的流式策略引擎 资讯

9个最佳的大数据处理编程语言 经验

对程序员说点实在话 资讯

IBM如何拥抱Spark 资讯

Spark SQL中对Json支持的详细介绍 经验

夜话存储：从调侃OpenStack和Ceph谈起 经验

部署大数据？请参考大数据分析平台架构(Big Data Analytics Platform) 经验

120行代码实现基于Meteor的即时搜索工具 经验

Kafka知识点汇总 经验

分布式日志系统：Scribe 经验

每个软件工程师都应该知道的有关实时数据的统一概念 经验

Apache软件基金会庆祝15年的开放源码创新和社区的领导地位 资讯

一个SparkSQL作业的一生 资讯

storm简介 经验

GitHub上整理的一些工具 经验

Storm是如何成为Apache顶级项目的 经验

K-means Hadoop 的相关搜索

关键词

9个最佳的大数据处理编程语言经验

搜索离线生产集群中的流计算文档

图灵访谈： IBM美女工程师Holden Karau：寻找友善的人一起共事资讯

2018年Java，Web和移动程序员学习的12个框架资讯

Apache Eagle v0.4.0发布，一个高效分布式的流式策略引擎资讯

9个最佳的大数据处理编程语言经验

对程序员说点实在话资讯

Spark SQL中对Json支持的详细介绍经验

夜话存储：从调侃OpenStack和Ceph谈起经验

120行代码实现基于Meteor的即时搜索工具经验

Kafka知识点汇总经验

每个软件工程师都应该知道的有关实时数据的统一概念经验

Apache软件基金会庆祝15年的开放源码创新和社区的领导地位资讯

一个SparkSQL作业的一生资讯

storm简介经验

GitHub上整理的一些工具经验

Storm是如何成为Apache顶级项目的经验