2014年排名前10位的开源项目 资讯

popular web apps . Apache Hadoop framework for big data "Apache Hadoop is an open source software

jopen 2015-01-26   12229   0

利用Facebook开源项目来赚钱不再只是梦 资讯

得到了外部公司的支持,其中就包括:Airbnb,Dropbox 和 Netflix。 像 Hadoop 这样新的大数据工具让公司比较廉价而高效地存储和分析海量数据。但是他们最终要求严格编程来分开使

dy223 2015-03-26   12276   0

一分钟了解Storm 经验

过去的数十年中,数据处理领域有着重大的变革。MapReduce和Hadoop以及相关技术使得存储和处理过去无法想象的规模的数据。不幸的是,这些数据处理技术并不是实时性的,也没有把Hadoop改造成实时数据处理的系统;实时数据处理相对于普通的批处理有基本的不同和需求。

jopen 2015-09-21   8016   0

十一个开源云计算资源推荐 博客

Cloudera 开源Hadoop软件框架是一个基于集群的框架,灵活地实现了大规模数据的查询等任务,也因此,在云计算部署中的应用越来越广泛。Apache 基金会对Hadoop予以了很高的评价,而且,

quguiliang 2011-03-10   1338   0

Facebook架构解读 经验

。 用MySQL、Memcached[5]、Hadoop’s HBase[6]实现持久化;用Memcached作为MySQL缓存与通用缓存。 用Hadoop和Hive实现离线处理。 类似日志、链接与f

jopen 2016-01-19   25626   0

总结2014年10个最好的开源项目 资讯

popular web apps . Apache Hadoop framework for big data "Apache Hadoop is an open source software

jopen 2014-12-17   20297   0

改变世界的七个Java项目 资讯

开发的质量。 Hadoop 这个著名的 MapReduce 模型是用 Java 实现的,它是驱动大多数“大数据”系统的源动力。由于可以降低从大数据中抽取有价值的数据的成本,Hadoop 已经被广泛使用。很多像

jopen 2014-03-11   15205   0
Java  

从数据仓库系统对比看Hive发展前景 资讯

这样的分布式框架,简化了并行程序的开发,提供了水平扩展和容错能力。 虽然 MapReduce(Hadoop)的应用非常广泛,但这类框架暴露出来的编程接口仍然比较低级,编写复杂处理程序或 Ad-hoc

jopen 2012-05-30   18467   0
Hive  

MySQL的备份与恢复 经验

数据库名称为datacrawldb,数据库存储引擎为MyISAM。数据库运行在本地上,备份数据存储在主机名称为hadoop00的服务器上。 备份方案:周一到周日每天凌晨1:30实现一次物理备份,周日凌晨2:30实现一

jopen 2014-07-30   16892   0

含 Apache Spark 的 Lambda 架构 经验

洁干净,而且附上直接明了的实例! Apache Hadoop: 简要历史 Apache Hadoop的丰富历史开始于大约2002年。Hadoop是Doug Cutting创立的, 他也是Apache

wwang1969 2016-11-10   10257   0

御膳房:构建大数据的美食厨房 经验

应对内外技术挑战 御膳房曾在技术上面临着巨大的挑战。御膳房原型验证阶段基于Hadoop集群,面对Hadoop在部署、Fix Bug、升级、资源隔离、保证用户数据访问安全和BI应用程序安全等方面

jopen 2014-10-30   31624   0
P6

  hbase获取不同版本 文档

HBase import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration;

acmers2008 2016-10-20   4550   0

MySQL的备份与恢复 经验

数据库名称为datacrawl,数据库存储引擎为MyISAM。数据库运行在本地上,备份数据存储在主机名称为hadoop00的服务器上。 备份方案:周一到周日每天凌晨1:30实现一次物理备份,周日凌晨2:30实现一

jopen 2013-10-19   49279   0
P4

  Hive QL 详解 文档

Java私塾Hive QL详解 第一部分:Hadoop 计算框架的特性 什么是数据倾斜 •由于数据的不均衡原因,导致数据分布不均匀,造成数据大量的集中到一点,造成数据热点 Hadoop框架的特性 •不怕数据大,怕数据倾斜

suunny 2014-01-09   1564   0

顽疾反复发作:大数据技术领域的九大痛点 资讯

http://developer.51cto.com/art/201508/487947.htm 尽管在Hadoop与NoSQL部署方面做足了准备,同样的问题仍然一次又一次反复出现。现在业界是时候尽快搞定这些麻烦事了。

jopen 2015-08-10   15908   0

推升R成为支持企业端与云端跨平台分析的企业标准 资讯

这次,有更多令人感到兴奋的新功能要公佈,这些功能可以协助新的平台、开发者、或是 R 社群提供以 R 为基础的分析技术,包括: 支持 Hadoop、Linux、和 Teradata 的 Revolution R Enterprise 已经内建在

jopen 2016-02-18   23299   0

转载---大数据概念 博客

y、Veracity。 目录 百科名片 例子 技术 影响 大数据价值 大数据治理 大数据与Hadoop 大数据与流数据分析 什么是流? IBM InfoSphere Streams 商业模式 IBM的大数据战略

chyx413332087 2013-02-06   976   0

Apache Kylin在百度地图的实践 资讯

he Kylin的首次完整部署。 Apache Kylin是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开

jopen 2016-01-05   55700   1
P10

  分布式计算(Map/Reduce) 文档

分布式式计算,同样是一个宽泛的概念,在这里,它狭义的指代,按Google Map/Reduce框架所设计的分布式框架。在Hadoop中,分布式文件系统,很大程度上,是为各种分布式计算需求所服务的。我们说分布式文件系统就是加了分

wanboy 2012-09-03   642   0
P10

  分布式计算(Map/Reduce) 文档

分布式式计算,同样是一个宽泛的概念,在这里,它狭义的指代,按Google Map/Reduce框架所设计的分布式框架。在Hadoop中,分布式文件系统,很大程度上,是为各种分布式计算需求所服务的。我们说分布式文件系统就是加了分

萧萧若水 2011-10-30   3954   0
1 2 3 4 5 6 7 8 9 10