开源项目,开源代码,开源文档,开源新闻,开源社区

将对开源实时大数据分析项目Apache Spark进行大规模资助，蓝色巨人宣称，其资助的力度之大相当于每年数亿美元的投入。 Hadoop技术出自Google、Yahoo这些互联网公司，主要是为了对规模庞大的各类数据进行处理和分析。不过近年来随着大数据应用的流

jopen 2015-06-15 18185 0

Spark

的薪水。 Hadoop 相比使用Hadoop厂商的产品，更多的人在使用Apache Hadoop。同时采用EMR(Hadoop云端服务)和使用Hortonworks的人差不多。Hadoop使用者薪水差

wpwan 2016-12-10 603 0

报告 Apache Python Scala SQL

chinacloud.cn/show.aspx?id=22168&cid=12 Apache Hadoop是一个成熟的开发框架,其连接着庞大的生态系统，并且得到了Cloudera、Hortonwork

jopen 2015-10-29 11656 0

Spark

Apache Hadoop是一个成熟的开发框架,其连接着庞大的生态系统，并且得到了Cloudera、Hortonwork、Yahoo这些卓越机构的支持与贡献，并且为各个组织提供了许多工具来管理不同大小规则的数据。

勿忘初心321 2015-12-21 32298 2

数据分析 HDFS Hadoop Spark

P17

zhouchen.zm@taobao.com 2010-09-04 2. 主要内容淘宝的数据云梯介绍对Hadoop的主要功能扩展与改造 Hive实践对Hive的改造分布式数据仓库构思 3. 淘宝的数据Oracle

qooxdoo 2010-11-28 5389 0

淘宝分布式/云计算/大数据淘宝分布式数据处理实践方案 Java

Spark 是在 Scala 语言中实现的，它将 Scala 用作其应用程序框架。与 Hadoop 不同，Spark 和 Scala 能够紧密集成，其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。

jopen 2014-08-14 51313 0

分布式/云计算/大数据 Spark

可热的原因之一是：在企业大数据应用的早期阶段， Hadoop只是穷人的ETL 。二、Hadoop开发者（15-17.5万美元） Hadoop是基于Java的开源框架，随着数据集规模不断增大，

jopen 2014-01-16 13983 0

大数据

这些年来，Hadoop，这个曾经飞速发展的开源平台，催生了许多公司并形成了一套供应商生态系统。人们也一直相信一些大公司会从中脱颖而出，果然，Hortonworks 在 2014 年上市。三年后，Cloudera

jopen 2018-10-08 5356 0

Cloudera Hortonworks

with Hadoop Cloudera为了让Hadoop的配置标准化，可以帮助企业安装，配置，运行hadoop以达到大规模企业数据的处理和分析。 Marp是一个比现有Hadoop分布式文件

jopen 2015-01-05 7882 0

开源

， Hadoop 相关软件存放目录： /home/yujianxin/hadoop。 Spark集群示意图一、具体安装步骤 1、安装jdk 2、安装Hadoop集群，参考

jopen 2015-01-16 23746 0

Spark 分布式/云计算/大数据

Pig是什么 Hadoop上的数据流执行引擎（由Yahoo！开源）利用HDFS存储数据利用MapReduce处理数据使用Pig Latin语言表达数据流 Pig Latin是一种新的数据流语言

jopen 2016-01-20 8421 0

分布式/云计算/大数据

月，该公司发布了在 Apache Hadoop“本地”运行的版本。该产品不是连接器，实际上是运行在 Hadoop 栈的软件，无需来回传输数据。这使得用户能压缩数据并存储在 Hadoop，可使用传统 SQL 查询而无需编写

jopen 2012-10-05 6395 0

NewSQL

P50

大数据面临的两大挑战 18. Hadoop起源GoogleMapReduceBigTableGFSChubbyGFS  HDFS MapReduce  Hadoop MRBigTable  HBase

lxj2008 2014-01-19 13806 0

分布式/云计算/大数据方案报告 Apache Go

HBase是Apache Hadoop的数据库，能够对大型数据提供随机、实时的读写访问。HBase的目标是存储并处理大型的数据。HBase是一个开源的，分布式的，多版本的，面向列的存储模型。它存储的是松散型数据。

jopen 2012-06-03 35865 0

HBase 分布式/云计算/大数据

推荐指数：四颗星今天先写到这儿吧，基本上都是一些入门书，还有一些在印象笔记里，回去再总结。下次写看过的hadoop/Python/Spark的书，以及一些比较不错的论文。 #---------------

cy_ygs 2016-04-12 35448 0

数据挖掘数据分析分布式/云计算/大数据

Sentry是Cloudera公司发布的一个Hadoop开源组件，它提供了细粒度级、基于角色的授权以及多租户的管理模式。Hadoop在文件系统层面有强安全策略，但缺乏对数据和BI应用细粒度的权限访问支持。这个问题使得Hadoop使用者面

jopen 2016-06-18 20327 0

Hadoop Apache Sentry

P110

Hbase编程学习笔记概述 HBase – Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

wudawen 2015-09-10 2850 0

NoSQL数据库

http://www.focustar.net Twitter利用Storm系统处理实时大数据 Hadoop（大数据分析领域无可争辩的王者）专注于批处理。这种模型对许多情形（比如为网页建立索引）已经足够

pwgw 2016-02-04 404 0

分布式/云计算/大数据

可以运行不同的分布式计算平台，如Spark、Storm、Hadoop、Marathon和Chronos等。Spark、Storm和Hadoop这样的计算平台有任务调度功能，可以直接使用Mesos SD

BetBarnard 2016-08-18 17982 0

Mesos Docker 分布式计算

模式，随后的版本在逐渐地完善。在YARN 上启动 Spark 确保HADOOP_CONF_DIR或YARN_CONF_DIR属性的值已经指向了Hadoop 集群的配置文件。 Spark 通常使用这些配置信息来向

jopen 2016-01-08 22741 0

YARN Spark 分布式/云计算/大数据

K-means Hadoop 的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

Python Java SQL Apache Scala Hadoop HBase 数据挖掘大数据 NewSQL Spark 分布式计算 Cloudera Docker 数据分析 HDFS YARN Mesos Apache Sentry 分布式/云计算/大数据 NoSQL数据库 Hortonworks 淘宝分布式数据处理实践

助人就是助己：IBM宣布大规模资助开源大数据项目Spark 资讯

《2016数据科学从业者薪酬调查报告》摘要解读文档

运用Spark加速实时数据分析资讯

如何运用Spark进行实时数据分析资讯

淘宝分布式数据处理实践文档

什么是spark 经验

2014 年八大最热门的大数据工作资讯

两开源平台Cloudera/Hortonworks以52亿美元价格合并资讯

2015 年有望 IPO 的 27 大科技公司，不乏开源资讯

搭建Spark完全分布式集群经验

大数据(十) - Pig 经验

NewSQL数据库开发商RainStor再融资1200万美元资讯

大数据及相关技术介绍文档

HBase 系统架构经验

数据分析/数据挖掘/机器学习---- 必读书目经验

Apache Sentry v1.7.0 发布资讯

Hbase 编程学习笔记文档

Twitter利用Storm系统处理实时大数据文档

Mesos和Docker分布式计算平台经验

在YARN上运行Spark 经验

K-means Hadoop 的相关搜索

关键词

助人就是助己：IBM宣布大规模资助开源大数据项目Spark 资讯

《2016数据科学从业者薪酬调查报告》摘要解读 文档

运用Spark加速实时数据分析 资讯

如何运用Spark进行实时数据分析 资讯

淘宝分布式数据处理实践 文档

什么是spark 经验

2014 年八大最热门的大数据工作 资讯

两开源平台Cloudera/Hortonworks以52亿美元价格合并 资讯

2015 年有望 IPO 的 27 大科技公司，不乏开源 资讯

搭建Spark完全分布式集群 经验

大数据(十) - Pig 经验

NewSQL数据库开发商RainStor再融资1200万美元 资讯

大数据及相关技术介绍 文档

HBase 系统架构 经验

数据分析/数据挖掘/机器学习---- 必读书目 经验

Apache Sentry v1.7.0 发布 资讯

Hbase 编程学习笔记 文档

Twitter利用Storm系统处理实时大数据 文档

Mesos和Docker分布式计算平台 经验

在YARN上运行Spark 经验

K-means Hadoop 的相关搜索

关键词

《2016数据科学从业者薪酬调查报告》摘要解读文档

运用Spark加速实时数据分析资讯

如何运用Spark进行实时数据分析资讯

淘宝分布式数据处理实践文档

2014 年八大最热门的大数据工作资讯

两开源平台Cloudera/Hortonworks以52亿美元价格合并资讯

2015 年有望 IPO 的 27 大科技公司，不乏开源资讯

搭建Spark完全分布式集群经验

NewSQL数据库开发商RainStor再融资1200万美元资讯

大数据及相关技术介绍文档

HBase 系统架构经验

数据分析/数据挖掘/机器学习---- 必读书目经验

Apache Sentry v1.7.0 发布资讯

Hbase 编程学习笔记文档

Twitter利用Storm系统处理实时大数据文档

Mesos和Docker分布式计算平台经验