开源项目,开源代码,开源文档,开源新闻,开源社区

不适应这种巨大的存储量和计算要求，基本是淘汰出局。在已知的几种大数据处理软件中，Hadoop的HBase 采用列存储，MongoDB是文档型的行存储，Lexst是二进制型的行存储。在这里，我不讨论这些

jopen 2012-07-02 15981 0

数据存取

achitecture里，Storm的定位在流式处理，而做类似ad-hoc的service layer是HBase。如果换做是我们目前的增量计算框架的愿景的话，我认为，流式和ad-hoc这层有望被增量计算引擎统一。为什么？

jopen 2015-01-16 18290 0

布式计算分布式/云计算/大数据

Hadoop、Apache Spark 等。在大数据和分布式存储方面，我们可以选择 Apache HBase、Apache Cassandra、Memcached、Redis、MongoDB等。在分布式监

BQCBrent 2017-03-07 12825 0

分布式系统分布式/云计算/大数据

的”，因为一个节点上的内存会被若干个服务共享，比如一部分给YARN，一部分给HDFS，一部分给HBase等，YARN配置的只是自己可以使用的，配置参数如下：（1）yarn.nodemanager

jopen 2014-07-09 14872 0

Hadoop 分布式/云计算/大数据

通过高速服务器Cache缓存数据库数据 2.内存数据库（这里仅从数据缓存方面考虑，当然，后期可以采用Hadoop+HBase+Hive等分布式存储分析平台）三、主流解Cache和数据库对比：上述技术基本上代表

jopen 2014-09-02 396591 0

Memcache Redis MongoDB NoSQL数据库

cmd一样！ hadoop4win ：是一个集成包包括cygwin、hadoop、jdk、hbase。这些都是hadoop需要的，安装上hadoop4win都包括了，直接运行hadoop就行了。这

jopen 2016-01-04 22817 0

分布式/云计算/大数据

订单表，可能导致一些意想不到的问题扩展性问题：交易系统如果以后想把订单表从RDBMS迁到HBase可能就没那么容易了，因为还有很多其他系统也依赖于订单表，真可谓牵一发而动全身；或者各个系统可能擅自做主给表增减字段，都会带来不好后果

jopen 2015-07-24 45692 0

微服务软件架构

分布式文件系统（HDFS）——之外，也有一个大数据工具的生态系统构建在 Hadoop 之上，包括以下内容： Apache HBase 的是针对大表的分布式数据库。 Apache Hive 是一个数据仓库中的基础设施，它允许在 HDFS

jopen 2014-04-13 13945 0

大数据

里也有N多的中间件框架和技术。另外分布式文件系统 GFS/TFS，分布式计算系统 Hadoop/Hbase 等等，分布式的东西都不神秘了。技术的实现在以前可能是问题，现在不是了。对于云计算工程方面，现在最难的是运维。管

jopen 2014-09-24 15548 1

云计算

我希望在后Hadoop时代下面这些技术能够更具竞争性。尽管许多Apache社区的项目和商业化Hadoop项目都非常活跃，并以来自HBase、Hive和下一代MapReduce（YARN）的技术不断完善着Hadoop体系，我依然认为，

jopen 2015-01-10 10742 0

Hadoop

Sink负责从管道中读出数据并发给下一个Agent或者最终的目的地。Sink支持的不同目的地种类包括：HDFS，HBASE，Solr，ElasticSearch，File，Logger或者其它的Flume Agent。

jopen 2016-01-13 37001 0

大数据 Flume

S离线历史数据进行批量处理。Wormhole不光支持落地多Sink，还支持流上处理，还可以在落HBase之前流上做一些数据清洗扩展等操作。目前我们的任务机器人HIT的训练主题“问题诊断”的计算模型都是

jopen 2017-09-11 21822 0

开源

P39

赖 14. 解决方案从前 Oracle 小型机高端存储现在 MySQL，OceanBase，Hbase，Oracle，MongoDB等普通PC服务器 15. DBMS：分库与分表业务逻辑支持扩展性

noblemoon 2012-03-21 4675 0

分布式/云计算/大数据方案 SQL

P22

L 控制？ 15. 数据安全的相关工作静态数据安全访问控制：Apache Accumulo，Hbase 加密：HADOOP-10150 数据脱敏/匿名化去标识符，但基于准标识符（quasi identifiers）仍能重新标识化

cpp45 2015-01-18 627 0

分布式/云计算/大数据方案 Apache Intel diff

P20

取前一条数据或者后一条数据，一般用于环比、同比分组，group by需要SORT,memory不需要从Hbase中查询数据获取配置文件中参数或者数据流中的参数，赋值给字段将字段设置成变量 19. 案例介绍（1）

junb_chen 2017-04-23 1508 0

数据挖掘培训 HTTP SQL XML

介绍:支持PB数据量级的多维非关系型大表，在google内部应用广泛，大数据的奠基作品之一， Hbase就是参考BigTable设计。 Bigtable的主要技术特点包括：基于GFS实现数据高可靠，

jopen 2015-07-10 24825 0

分布式系统分布式/云计算/大数据

Sink负责从管道中读出数据并发给下一个Agent或者最终的目的地。Sink支持的不同目的地种类包括：HDFS，HBASE，Solr，ElasticSearch，File，Logger或者其它的Flume Agent

jopen 2015-11-02 40026 0

大数据分布式/云计算/大数据

，当然当前对于开源的Kettle和Talend本身也集成了大数据集成内容，可以实现和hdfs，hbase和主流Nosq数据库之间的数据同步和集成。而淘宝的DataX则主要可以实现常见主流的结构化数据库（Oracle

BraHewitt 2016-04-13 27311 0

数据库大数据分布式/云计算/大数据

而依然存在可伸缩性的问题。另一个相当年轻，却在2013年非常流行的数据库便是 Titan 。作为后端无关的图数据库，它支持 HBase 和 Cassandra 的可伸缩架构，并且如 2013年的一篇博文所报道的，它在内部使用了一

jopen 2014-04-15 8946 0

大数据

merge。有啥不对或不懂的，当面去请教！内部的基础设施真是棒极了。比如 hadoop/pig/hbase/hive/openstack/docker/chef，如果你只是小规模用用，不用申请，直接上。雅虎有世界最大的

g2b4 2015-03-24 12120 0

雅虎

大数据存取的选择：行存储还是列存储？资讯

谈谈分布式计算的算子层经验

用大白话聊聊分布式系统经验

Hadoop YARN中内存和CPU两种资源的调度和隔离经验

Memcache,Redis,MongoDB（数据缓存系统）方案对比与分析经验

云平台hadoop搭建以及wordcount实例运行经验

微服务架构实践总结经验

大数据处理的开发经验资讯

云计算：拼的是运维资讯

Hadoop的生命周期有多久？资讯

你一定需要六款大数据采集平台的架构分析资讯

宜信正式开源其AIOps落地三大利器资讯

大数据解决之道 - 淘宝OceanBase开发组文档

大数据应用 - 数据安全和数据分析文档

kettle 基础整理文档

分布式系统(Distributed System)资料经验

大数据系统数据采集产品的架构分析经验

大数据-数据采集和集成经验

利用大数据技术进行图处理资讯

雅虎北研的福利：薪资完爆BAT，解决北京户口资讯

HBase ͼƬ�洢的相关搜索

关键词

大数据存取的选择：行存储还是列存储？ 资讯

谈谈分布式计算的算子层 经验

用大白话聊聊分布式系统 经验

Hadoop YARN中内存和CPU两种资源的调度和隔离 经验

Memcache,Redis,MongoDB（数据缓存系统）方案对比与分析 经验

云平台hadoop搭建以及wordcount实例运行 经验

微服务架构实践总结 经验

大数据处理的开发经验 资讯

云计算：拼的是运维 资讯

Hadoop的生命周期有多久？ 资讯

你一定需要 六款大数据采集平台的架构分析 资讯

宜信正式开源其AIOps落地三大利器 资讯

大数据解决之道 - 淘宝OceanBase开发组 文档

大数据应用 - 数据安全和数据分析 文档

kettle 基础整理 文档

分布式系统(Distributed System)资料 经验

大数据系统数据采集产品的架构分析 经验

大数据-数据采集和集成 经验

利用大数据技术进行图处理 资讯

雅虎北研的福利：薪资完爆BAT，解决北京户口 资讯

HBase ͼƬ�洢 的相关搜索

关键词