Hadoop 迭代式计算框架:Guagua 经验

Hadoop 迭代式计算框架 Guagua 是 PayPal 的一个开源机器学习框架 Shifu 的子项目。Guagua 主要解决了模型训练的分布式问题。同时 Guagua 并没有将自己局限在分类模型,Guagua

jopen 2014-07-30   14227   0

Hadoop log4j日志说明 经验

system properties hadoop.root.logger=INFO,console hadoop.log.dir=. hadoop.log.file=hadoop.log # # Job Summary

jopen 2013-12-27   53598   0

腾讯TDW:大型Hadoop集群应用 经验

distributed Data Warehouse,腾讯分布式数据仓库)基于开源软件Hadoop和Hive进行构建,打破了传统数据仓库不能线性扩展、可控性差的局限,并且根据腾讯数据量大、计算复杂等特定情况进行了大量优化和改造。

jopen 2015-07-28   19632   0

hadoop2.7.1环境搭建 经验

在老板的支持下,陆续划拉到了10几台机器,绑定了固定IP,工作之余开始了Hadoop之旅。将要点记录下来,以备查阅。 硬件构成: Resource Volume CPU 2 cores

jopen 2015-12-29   9501   0

Hadoop 2.6 + Hive 1.2.1 + spark-1.4.1(3) 经验

分桶便于有用数据加载到 有限的 内存中 (性能上的优化 ---- 还有 join,group by,distinct ) row format delimited    -- 指定分隔符解析数据 fields

jopen 2015-12-29   9440   0

CG_Hadoop:基于MapReduce的计算几何 经验

摘要: Hadoop使用了MapReduce编程范式,目前已经被公认为是分布 式环境中分析大数据的标准框架。然而,它并不能很好的应用于大规模的计算几何处理。本文介绍的CG_Hadoop是一套可伸缩的和高效的

jopen 2016-01-05   23913   0

如何让Hadoop支持优先级且性能可预测 经验

Apache Hadoop近十年的成长证明,用开源技术处理与访问海量数据并不是什么炒作。然而,Hadoop的一个缺点是不可预测性。Hadoop不能确保企业的关键任务按时完成,也不能完全发挥集群的性能。

LukeOlivare 2016-06-17   11606   0

hadoop再次集群搭建(1)-安装系统 经验

从8月份到现在12月份,中间有四个月的时间没有学习hadoop系统了。其实适应新的环境,到现在一切尘埃落定,就应该静下心来,好好学习一下hadoop以及我之前很想学习的mahout。个人对算法比较感兴

jopen 2016-01-18   8681   0

RedHat开源其Hadoop存储系统 资讯

作为大数据+混合云业务战略的一部分,Red Hat 没有选择推出自己的 hadoop 商业版本或者收购一家 Hadoop 发行厂商,而是推出了首个 Hadoop HDFS 文件存储系统的开源替代产品。

jopen 2013-02-22   8798   0
Hadoop  

Spring for Apache Hadoop 1.0 RC1 发布 资讯

Spring Hadoop 为开发 Apache Hadoop 应用程序提供支持,充分利用 Spring, Spring Batch 和 Spring Integration 等项目提供的功能。 Changes

jopen 2012-10-18   9698   0
Hadoop  

官方正式发布 Apache Hadoop 2.5.0 版本 资讯

尽管下载文件在前几天已经发布,不过官网上今天才发布了 Apache Hadoop 2.5.0 正式版,这是一个小更新版本,包括一些主要新特性和改进以及 Bug 修复,例如扩展文件属性和改进 HDFS 的 Web UI,提升 ATS 安全性,更丰富的

jopen 2014-08-15   6456   0

Azure HDInsight与Hadoop周边系统集成 资讯

传统的Hadoop系统提供给用户2个非常优秀的框架,MR计算框架和HDFS存储框架,尽管MR已经显得有些老迈而缓慢,但是HDFS还是很多 应用系统的基石,很多应用都可以把HDFS作为系统的基本数据输入和

jopen 2015-02-14   12214   0
Hadoop  

Spring for Apache Hadoop 2.1.0.M3 发布 资讯

Spring for Apache Hadoop 提供了 Spring 框架用于创建和运行 Hadoop MapReduce、Hive 和 Pig 作业的功能,包括 HDFS 和 HBase。如果你需要简单的基于

码头工人 2014-12-19   20627   0

Docker将会改变Hadoop,变的更快更容易 资讯

最近在San Jose,Clif开幕的hadoop峰会上会有关于Docker和Hadoop的话题讨论,越来越多的创业公司致力于使用Docker技术来简化hadoop应用开发部署的速度。 目前有两个方

jopen 2015-06-22   29562   0
Docker  

Spring for Apache Hadoop 2.3.0 GA 发布 资讯

Spring for Apache Hadoop 提供了 Spring 框架用于创建和运行 Hadoop MapReduce、Hive 和 Pig 作业的功能,包括 HDFS 和 HBase。如果你需要简单的基于

jopen 2015-12-22   13652   0

Apache Bigtop 1.1.0 发布,Hadoop 交互测试 资讯

was added to the support matrix * most stable Hadoop 2.7.1 is used * new data notebooks project Zeppelin

jopen 2016-02-17   4938   0
P17

  Centos6 Hadoop 安装笔记 文档

Centos6 Hadoop1.2 安装 HelloWorld级 Centos6 Hadoop安装笔记 一、 单机版安装 1.1 系统安装 安装操作系统的时候,请分好区,尽量给一个空间的地方使用Had

r_s 2013-06-19   4424   0
P15

  Hadoop+Hbase搭建云存储总结 文档

 Hadoop+Hbase搭建云存储总结 Hadoop文件系统Hadoop文件系统是一个能够兼容普通硬件环境的分布式文件系统, 和现有的分布式文件系统不同的地方是Hadoop更注重容错性和兼容廉

ccop 2013-04-18   537   0
P8

  VM下配置Hadoop详细教程 文档

VM下配置Hadoop详细教程 前言: Hadoop是一个分布式系统基础架构,主要是由HDFS、MapReduce和Hbase组成,分别为Google集群系统GFS、MapReduce、BigTab

janee81930 2012-07-23   721   0
P5

  Hadoop序列化机制 文档

interprocess communication and for persistent storage. In Hadoop, interprocess communication between nodes in the

ck614 2010-11-10   4246   0
1 2 3 4 5 6 7 8 9 10