P11

  ubuntu下安装配置hadoop1.0.4 文档

javascript  helloworld hadoop mapreduce java hadoop hbase  当出现org.apache.hadoop.hdfs.server.namenode.SafeModeException:

zhangbc 2013-09-06   757   0
P30

  淘宝Hadoop与数据分析 文档

分布式文件系统HDFS MapReduce框架 并行数据分析语言Pig 列存储NoSQL数据库 Hbase 分布式协调器Zookeeper 数据仓库Hive(使用SQL) Hadoop日志分析工具ChukwaHadoop生态系统

lxz 2014-01-03   3863   0
P19

  京东智能云服务平台 文档

移动网关JOS授权API个人数据存储家居健康长连接网关核心模型媒体车载设备联动引擎DB缓存云云存储语义解析引擎HBASE基本架构云海 8. 智能云超级APPhttps://gw.smart.jd.com长连接服务De

g4mm 2015-04-24   3968   0
方案  

impala笔记 经验

impala与hadoop生态结合紧密 (1) HDFS是impala最主要的数据源。 除此之外, impala也支持HBase,甚至支持S3存储。 (2) impala表定义存储在hive metastore中, 支持读取hive表定义。

er74 2015-07-26   61584   0

应用层的容错与分层设计 经验

全部耦合在一起,也造成维护成本进一步加大。 比如之前一些服务开发中碰到的类似如下的问题: hbase-client由于没有实现容错设计,导致访问出现了抖动,影响了同一服务池的其他调用,需要增加类似MySQL

jopen 2014-11-10   12511   0
设计  

BigInsights:解读IBM基于Hadoop的数据分析平台 资讯

SQL Hive 是一种数据仓库基础架构,设计用于支持批量查询和分析 Hadoop 管理的文件 HBase 是一种以列为主的数据存储环境,设计用于支持 Hadoop 中的稀疏填充的大型表格 Flume 是一种用来数据收集并将其加载到

openkk 2012-02-25   30861   0
Hadoop  

指点迷津的现代数据数据架构之道 资讯

如Apache Spark内存处理引擎、Apache Hive数据仓库基础设施和Apache HBase NoSQL存储系统。 企业要将大数据纳入到其核心企业数据架构,势必需要改动或购置大数据即服

jopen 2016-03-09   4973   0

Ruby类库、工具、框架和软件集合:Awesome Ruby 经验

tool Database Drivers Cassandra Driver - A pure ruby driver for Apache Cassandra with asynchronous io

jopen 2014-10-12   102843   0

如何使用 Node.js 和 Docker 构建高质量的微服务 经验

ase \ -e "KONG_DATABASE=postgres" \ -e "KONG_CASSANDRA_CONTACT_POINTS=kong-database" \ -e "KONG_PG_HOST=kong-database"

ywjs8152 2016-11-07   19169   0

2015年编程语言“钱途”盘点 资讯

Java,因为它比较稳定、比较容易扩展。 随着 Spark(使用 Scala 语言)和 Cassandra(支持其他语言)这两种大数据管理框架日渐崛起,很难说 Hadoop 保持最流行的大数据管理框

jopen 2015-12-07   27469   0

基于 SDN 的虚拟私有云研究 经验

,并提供类似SQL式的查询。系统组成以数据为中心,数据的存储有Cassandra、 ZooKeeper、Redis等,Cassandra存储具体的网络配置信息,Zookeeper存储服务信息,提供服务发现功能,这两个都支持集群模

jopen 2015-06-25   35134   0
P45

  zookeeper 集群安装 文档

Hadoop,使用Zookeeper的事件處理確保整個集群只有一個NameNode,存儲配置信息等. HBase,使用Zookeeper的事件處理確保整個集群只有一個HMaster,察覺HRegionServer聯機和宕機

efeil 2012-09-07   2739   0

你真的很熟分布式和事务吗? 资讯

你选择MySQL分库、表、区,还是选择Redis,MongoDB作sharding?还是你直接就上HBase了? 二级索引在哪里? 其实很佩服一篇文章,几个图表,看起来很cool的架构图就把这些问题说得一清二楚,架构嘛。

y35w 2015-07-09   11656   0
事务  

Apache kafka 工作原理介绍 经验

是一个通用型系统。你可以有许多的生产者和消费者分享多个主题。相反地,Flume 被设计成特定用途的工作,特定地向 HDFS 和 HBase 发送出去。Flume 为了更好地为 HDFS 服务而做了特定的优化,并且与 Hadoop 的安

jopen 2015-08-11   22359   0
P23

  分布式运算平台-Hadoop-基础篇 文档

FS。 HDFS是为达到高数据吞吐量而优化的,这有可能会以延迟为代价。 目前,对于低延迟访问,HBase是更好的选择。 大量的小文件 名称节点(namenode)存储着文件系统的元数据, 因此文件数量的限制也由名称节点的内存量决定。

zhpboy 2013-10-12   3298   0

storm简介 经验

出现在实时统计、实时风控、实时推荐等场景中。一般来说,我们从类kafka的metaQ或者基于 hbase的timetunnel中读取实时日志消息,经过一系列处理,最终将处理结果写入到一个分布式存储中,提供给应用程序访问。我们每天的实时消息

jopen 2013-11-04   78329   0

RHadoop环境搭建 经验

mode) 3 HADOOP环境(这里只需要hadoop) hadoop-1.0.3  hbase-0.94.2  hive-0.9.0  pig-0.10.0  sqoop-1.4.2  thrift-0

jopen 2014-10-31   21736   0

GitHub上整理的一些工具 经验

Hadoop:分布式的文件系统,结合其MapReduce编程模型可以用来做海量数据的批处理(Hive,Pig,HBase啥的就不说了),值得介绍的是Cloudera的Hadoop分支CDH5,基于YARN MRv2集

jopen 2015-11-18   110476   0
Github  

量化派基于Hadoop、Spark、Storm的大数据风控架构 经验

储需要经常变化的状态类数据。 除了系统运行日志直接存放在HDFS之中,大量的数据利用HBase来进行管理。HBase中的数据按照不同的数据源存放在不同的表中,每张表按照业务和 存储需求对rowkey进

jopen 2015-10-06   52802   0

微服务与 RPC 经验

Evernote, Uber, Pinterest等大型互联网公司。 而在开源界,Apache hadoop/hbase也在使用Thrift作为内部通讯协议。 这是目前最为成熟的框架,优点在于稳定、高性能。缺点在于它

jhalbert 2017-02-22   25037   0
RPC   微服务  
1 2 3 4 5 6 7 8 9 10