数据收集系统 Chukwa 资讯

Chukwa,简单的说它是一个数据收集系统,它可以将各种各样类型的数据收集成适合 Hadoop 处理的文件保存在 HDFS 中供 HadoopHadoop 并不仅仅是一个用于存储的分布式文件系统,而是设计用来在

fmms 2011-09-25   14248   0

数据结构 博客

怎么才能精通数据结构 ?

seawater 2010-12-17   3094   0

大量数据优化 博客

大量数据优化常用方法 默认分类 2009-08-13 14:50:38 阅读 112 评论 0 字号: 中 小 订阅 具体要注意的: 1.应尽量避免在 where 子句中对字段进行 null

ck2265395 2011-09-16   1922   0
P5

  两台Ubuntu虚拟机部署Hadoop集群 文档

两台Ubuntu虚拟机部署Hadoop集群 1、 分别查看其 IP 地址:输入# ifconfig,可得主机 IP:192.168.211.130;分机为:192.168.211.132。 2、 在两台机器上的/etc/hosts

zzllzz 2013-03-16   511   0

Continuuity 首席执行官:Hadoop 真特么难用 资讯

在本周的大数据研讨会上,Continuuity的首席执行官指出Hadoop实施难度,极为难用,如果不解决技术复杂性问题,Hadoop将被自己终结。 Continuuity的首席执行官Todd P

jopen 2013-03-22   5976   0
Hadoop  

前雅虎 CTO 发布 Hadoop 云服务 Altiscale 资讯

雅虎前首席技术官Raymie Stata对Hadoop了解颇深,正是他于2006年将Hadoop发明者Doug Cutting招到雅虎。在雅虎担任首席架构师和CTO长达七年的时间中,Stata成功将Hadoop开发成Yahoo的所有web服务的基础,而将

jopen 2013-06-13   9555   0
Hadoop  

贾扬清:希望Caffe成为深度学习领域的Hadoop 资讯

备把这个计划实现出来(对一个研究生而言,GPU很贵的)。我从9月下旬开始,先自己攒了一个机器,然后 概花了两个多月的时间写了整个架构和ImageNet所需要的各个实现。起初纯粹是因为兴趣使然作为一个

jopen 2015-07-07   40649   0
Hadoop  

大象的崛起!Hadoop七年发展风雨录 资讯

争关系时候,招聘了Doug(Hadoop创始人),把Google老大赖以生存的DFS与Map-Reduce开源了,开始了Hadoop的童年时期。 差不多在2008年的时候,Hadoop才算逐渐成熟。 从

fmms 2011-09-11   30305   4

华为在Hadoop重要贡献公司名单内,排在Google和Cisco之前 资讯

Yahoo新成立的Hadoop公司Hortonworks,开始与Cloudera争夺领导者地位。 Hortonworks最近发布“Yahoo对Hadoop贡献”一文,标榜Yahoo是Hadoop最大贡献者,Cloudear

fmms 2011-10-08   8423   0
Hadoop  

eBay使用Hadoop和HBase成功构建下一代搜索 资讯

eBay 在 Hadoop 世界(Hadoop World)大会 的主题演讲中展示了一种全新的搜索引擎 Cassini 的架构,该引擎预计在2012年上线。它对所有的内容和用户的元数据进行索引来得到更好的排名,并每小时刷新索引。它使用

码头工人 2011-11-23   15897   0
Hadoop   HBase  

Facebook使用Corona提升Hadoop的可伸缩性 资讯

Corona Improves Hadoop Scalability At Facebook Facebook 已经 开源了 Corona ,这是一款内部开发的用以改善 Hadoop MapReduce 调度的软件。

jopen 2012-11-22   6643   0
P14

  基于Ubuntu14.04 的 Hadoop2.2 集群安装与配置 文档

 基于Ubuntu14.04的Hadoop2.2集群 安装与配置 基于Ubuntu的Hadoop集群安装与配置 一、目的 1、 掌握Hadoop原理机制,熟悉Hadoop集群体系结构、核心技术。 2、安装和配置Hadoop集群。

李新广 2015-07-10   4006   0

Apache Hadoop YARN的一个抽象层:Twill 经验

Twill是 Apache Hadoop YARN 的一个抽象层。它能够减少开发分布应用程序的复杂性,让开发人员可以更加关注他们的业务逻辑。它通过一个类似于Java线程的简单而直观的编程模型来暴露 Apache

jopen 2013-12-11   18505   0

基于Hadoop的海量图片存储模型 的分析和设计 经验

,分别是图片保存至数据库和图片存储在硬盘。鉴于海量图片规模下,数据库承载太多图片会导致数据库容量和效率成为极大的瓶颈。常见的做法是图片保存至硬盘,数据库中保存图片的存储路径。分布式存储为海量图片存储提

jopen 2014-01-02   84435   0
Hadoop  

hadoop 学习笔记:mapreduce框架详解 经验

hadoop 学习笔记:mapreduce框架详解 开始聊mapreduce,mapreduce是hadoop的计算框架,我 学hadoop是从hive开始入手,再到hdfs,当我学习hdfs

jopen 2014-08-29   30078   0

提高hadoop的mapreduce job效率笔记—–修改mapper和reducer数量 经验

hadoop 的mapreduce 的作业在运行过程中常常碰到一些这样的情况: 每一个map或者reduce只有30-40秒钟就结束 超大规模的job 时,通常会需要大量的map和reduce的slots

jopen 2016-01-16   7166   0

Hadoop2.6.0上的spark1.5.2集群搭建 经验

Spark 安装前提 安装 Spark 之前需要先安装 Hadoop 集群,因为之前已经安装了 hadoop ,所以我直接在之前的 hadoop 集群上安装 spark ,但是因为机器内存不够,我只选择

yvdyyn805 2016-01-27   45467   0

hadoop再次集群搭建(2)-配置免秘钥ssh登录 经验

key)实现基于git协议(底层使用SSH)远程库管理。 SSH(Secure Shell)是一个提供数据通信安全、远程登录、远程指令执行等功能的安全网络协议,由芬兰赫尔辛基大学研究员Tatu Ylöne

jopen 2016-01-18   16615   0

Kafka实战:从RDBMS到Hadoop,七步实现实时传输 经验

何将RDBMS实时数据流导入到HDFS的Hive表中。 对于那些想要把数据快速摄取到Hadoop中的企业来讲,Kafka是一个很好的选择。Kafka是什么?Kafka是一个分布式、可伸缩、可信赖的

P22

  MapReduce详解及Eclipse远程连接Hadoop开发MapReduce程序 文档

、MapReduce详解及Eclipse连接Hadoop开发MapReduce讲师:Cloudy[www.langsin.com]浪曦网版权所有 2. 第2页2018年10月23日Hadoop 命令类Linux shell

li270606338 2013-08-28   7576   0
1 2 3 4 5 6 7 8 9 10