一篇文章读懂大数据的黄色小象帮手––Hadoop 经验

cn/Hadoop/13701.html 继云计算之后,大数据(Big Data)接棒成为最热门的科技潮字,和大数据有关的技术和科技接二连三成为科技圈注目的焦点。如果你也关注云端跟大数据的资讯,Hadoop

jopen 2015-03-13   25945   0

详细讲解Hadoop中的一个简单数据库HBase 博客

HBase是 Hadoop中的一个简单数据库。它与Google的Bigtable特别相似,但也存在许多的不同之处。 数据模型 HBase数据库使用了和 Bigtable非常相似的数据模型。用户在表

Hadoopp 2012-09-28   1184   0

Apache Eagle:eBay开源分布式实时Hadoop数据安全引擎 经验

地保护Hadoop生态系统中大数据的安全。 Eagle在eBay的使用场景 目前,Eagle的数据行为监控系统已经部署到一个拥有2500多个节点的Hadoop集群之上,用以保护数百PB数据的安全,

jopen 2016-01-06   30988   0

Cascading - 基于Hadoop数据管理和分析框架 经验

Cascading是一个应用程序框架,能够帮助开发人员快速开发基于 Apache Hadoop 的 健壮数据分析和数据管理应用程序。 项目主页: http://www.open-open

openkk 2012-06-09   26819   0

一个全面的、用于Apache Hadoop数据保护的安全框架:Rhino 经验

Rhino项目是由Cloudera、Intel和Hadoop社区合力打造的一个项目。这个项目旨在为数据保护提供一个全面的安全框架。 Rhino项目为 HBase 0.98 贡献了关键的安全特性。它提供了数据单元(cell)级别的加密和细粒度访问权限控制的功能。

jopen 2014-08-24   12421   0

你的数据根本不够大,别老扯什么Hadoop 经验

本文原名 “Don’t use Hadoop when your data isn’t that big ” ,出自有着多年从业经验的数据科学家 Chris Stucchio ,纽约大学柯朗研究所博士

jopen 2014-08-31   32528   0

Kylin:基于Hadoop的开源数据仓库OLAP分析引擎 经验

Kylin是一个开源、分布式的OLAP分析引擎,它由eBay公司开发,并且基于Hadoop提供了SQL接口和OLAP接口,能够支持TB到 PB级别的数据量。OLAP即联机分析处理,它能够帮助分析人员、管理人员或执行人

jopen 2014-12-02   33465   0
P81

  Hadoop练习 - MapReduce 进行数据查询和实现推简单荐系统 文档

Hadoop练习—MapReduce进行数据查询和实现推简单荐系统 1  运行环境说明 1.1 硬软件环境 1.2 机器网络环境 2  书面作业1:计算员工相关 2.1 书面作业1内容 2.2  实现过程

whongji 2015-06-02   3286   0

SGI 将推出 Cloudera Hadoop 数据分析集群 资讯

系统提供商SGI宣布计划提供运行Hadoop数据分析平台的集群。 SGI Hadoop集群将完全支持Cloudera的发行版,包括 Apache Hadoop (CDH)在SGI的机架式服务器

fmms 2011-10-18   11087   0

Microsoft大数据计划:在Hadoop上用C#编程 资讯

Windows Azure 平台之上的 Hadoop。Microsoft 官方将未来支持 Windows Azure 和 Windows Server 的 Hadoop 框架的产品套件的代号定义为“Isotope”。

openkk 2012-03-02   11339   0
Hadoop  

BigInsights:解读IBM基于Hadoop数据分析平台 资讯

毫无疑问,大数据成了 2012 年的热门词。根据国外统计机构的报告,大数据处理在今年的市场规模已经达到 700 亿美元并且正以每年 15-20% 的速度增长。几乎所有主要的大科技公司都对大数据感兴趣,对

openkk 2012-02-25   30861   0
Hadoop  

超越Hadoop的大数据分析之图形处理尺寸 资讯

本文翻译自《 BIG DATA ANALYTICS BEYOND HADOOP 》译者:许巧辉 另一个来自Google的重要工具,看起来超越了Hadoop MR——Pregel框架实现了图形计算(Malewicez

jopen 2014-06-01   12671   0
Hadoop  

专访:大数据群雄逐鹿 Hadoop坚持开源? 资讯

com/opinions/602-专访-大数据群雄逐鹿-hadoop坚持开源? 出身名门雅虎的Hortonworks拥有许多优秀的Hadoop架构师与源代码的贡献者,它们为Apache Hadoop项目贡献了超过80%

jopen 2015-02-05   13300   0
Hadoop  

60款与Hadoop和大数据相关的顶级开源工具 资讯

说到处理大数据的工具,普通的开源解决方案(尤其是 Apache Hadoop )堪称中流砥柱。弗雷斯特调研公司的分析师 Mike Gualtieri 最近预测,在接下来几年,“ 100% 的大公司”会采用

jopen 2015-08-10   60740   0
Hadoop  

Apache Sqoop 1.99.6 发布,Hadoop 数据迁移 资讯

Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导入到Hadoop的HDFS中,也可以将HDFS的数据导入到关系型数据库中。

jopen 2015-05-12   13968   0

如何让Hadoop结合R语言做统计和大数据分析? 资讯

Analytics发起的一个开源项目RHadoop将R语言与Hadoop结合在一起,很好发挥了R语言特长。广大R语言爱好者借助强大工具RHadoop,可以在 大数据 领域大展拳脚,这对R语言程序员来说无疑是个喜讯

jopen 2015-12-23   48265   0
Hadoop  
P10

  Hadoop 集群测试报告 文档

 Hadoop集群测试报告 1.测试环境 硬件环境 软件环境 o RHEL6.2 2.6.32-220.el6.x86_64 o hadoop-1.0.2 o hive-0.8.1 o hbase-0

lenhan12345 2012-11-27   7980   0
P3

  广告商采用 Hadoop 文档

广告商采用 Hadoop 借助 Apache Hadoop 进行可靠的宣传和促销 消费者从未在自己如何搜索、讨论和购买产品上生成如此多的 数据。这种新数据对于品牌或产品的塑造和推广非常重要,但是并未

tony2007 2015-06-20   8022   0
P

Hadoop 1.2.1 API 规范 文档

Hadoop是一个分布式的计算平台。 Hadoop primarily consists of the Hadoop Distributed FileSystem (HDFS) and an implementation of the Map-Reduce programming paradigm.<br> Hadoop is a software framework that lets one easily write and run applications that process vast amounts of data. Here's what makes Hadoop especially useful:<br> 可扩展: Hadoop can reliably store and process petabytes. 廉价: It distributes the data and processing across clusters of commonly available computers. These clusters can number into the thousands of nodes. <br> 高效: By distributing the data, Hadoop can process it in parallel on the nodes where the data is located. This makes it extremely rapid. <br> 可靠: Hadoop automatically maintains multiple copies of data and automatically redeploys computing tasks based on failures.

mingmingok 2014-05-27   5722   0
P

Apache Hadoop Main 2.2.0 API 文档

Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。 Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算

colophus 2014-11-13   434   0
1 2 3 4 5 6 7 8 9 10