大数据盘点之Spark篇 资讯

谭政,Hulu 网大数据基础平台研发。曾在新浪微博平台工作过。专注于大数据存储和处理,对 Hadoop、HBase 以及 Spark 等等均有深入的了解。 Spark 最新的特性以及功能 2015 年中

jopen 2016-01-07   42951   0

Oozie4.2.0配置安装实战 经验

1,Hive0.14,Pig0.15.0,Maven3.2,JDK1.7,zookeeper3.4.6,HBase1.1.2,MySQL5.6 集群部署: node1~4.centos.com     node1~4

ltww3128 2016-01-23   82306   0

影响数据检索效率的几个因素 经验

取的数据也就非常少了。另外一个变种就是支持遍历的主键,比如hbase的rowkey。如果查询的是一个基于rowkey的范围,那么像hbase这样的数据库就可以支持只读取到这个范围内的数据,而不用读取不

jopen 2015-06-09   35005   0

Kafka技术内幕-日志压缩 经验

不需要,因为是内存数据库 Cassandra commit log data.db 需要,数据存在本地文件 HBase commit log HFile 需要,数据存在HDFS Kafka commit log commit

szz314159 2016-05-24   56223   0

Hadoop面试题,看看你能答对多少?答案在后面 经验

分析:lucene是支持随机读写的,而hdfs只支持随机读。但是HBase可以来补救。HBase提供随机读写,来解 决Hadoop不能处理的问题。HBase自底层设计开始即聚焦于各种可伸缩性问题:表可以很“高”

jopen 2014-12-12   31918   0

关于CarbonData+Spark SQL的一些应用实践和调优经验分享 经验

据分析,优化之前,老的系统需要用Impala和Hbase两个系统,建立4个二级索引才可以完成业务需要的性能。这其中,Impala用来做报表输出,Hbase做关键维度查询。这两个系统有各自存在不足:Im

AAFDell 2017-09-11   32989   0

Java工程师成神之路~ 资讯

Cache Redis Memcached Leveldb Bigtable HBase Cassandra Mongodb 图数据库 neo4j 3.3.3. 参考资料

jopen 2015-12-08   213763   15
Java  
P76

  淘宝数据开发平台介绍 文档

系统Hadoop Map ReduceHadoop HDFSDatax报表需求(淘数据)数据开发界面Hbase元数据中心 和 知识库…即席查询(adhoc)数据分析数据挖掘数据产品数据开发平台——产品架构数

hans511002 2012-06-24   4302   0

排名前10位的SQL和NoSQL数据库 资讯

newer alternative databases, with services like HBase, Cassandra and Teradata slowly gaining ground.

jopen 2014-09-09   21858   0
SQL   NOSQL  

Java实现的网络爬虫,Apache Nutch v2.3 发布 资讯

1.0.1 & 2.4.0 Apache Cassandra 2.0.2 Apache HBase 0.94.14 Apache Accumulo 1.5.1 MongoDB 2.12.2

m4ed 2015-01-31   18141   0

推荐系统大全Recommender Systems 经验

is built on technologies Apache Spark , Apache HBase and Spray . It is a machine learning server that

jopen 2015-03-20   18977   0

搜索引擎:HERMES 经验

自 己进行内存管理,关键地方的内存对象的创建和释放Java内部自己控制,减少GC的压力(类似Hbase的Block Buffer Cache)。 不使用WeakHashMap和全局锁,WeakHas

jopen 2014-12-23   13496   0

大数据领域一些实用工具 经验

Apache Hadoop NoSql 数据库 – MongoDB , Cassandra , Hbase SQL 数据库 – MySql (Oracle), MariaDB , PostgreSQL

y37f 2015-03-15   37847   0

基于hadoop 网络爬虫 经验

4.reduce阶段:主要任务是把所有的存储到hdfs货hbase种去。 三。心得 爬虫程序并不是hadoop典型应用场景。hadoop一般应用于海量数据

jopen 2013-12-26   84009   0

ZOOKEEPER基础 经验

搞数据开发的对一些产品非常熟悉,比如: HBase Hadoop … 但是对它们背后共同的“男人”没有太多的了解,太不应该了。这篇是一个基础的介绍,看完之后应该会对ZOOKEEPER有大概了解。 安装部署

jopen 2015-12-22   15093   0

Hortonworks宣布一款Hadoop数据平台 资讯

,一个元数据管理系统,此外还有一些常见的与 Hadoop 平台相结合使用的,Pig、Hive、HBase 及 Zookeeper 等。在接下来的几周里,Hortonworks 计划发布基于 Hadoop

openkk 2011-11-06   12989   1
Hadoop  

Apache Drill 1.0发布 资讯

Hadoop就成了竞争最激烈的技术领域。 5月19日,Apache基金会 宣布 针对Hadoop、NoSQL(MongoDB和HBase)和云存储(Amazon S3, Google Cloud Storage, Azure Blog

jopen 2015-05-20   10665   0

青云QingCloud上线分布式关系型数据库PolonDB 资讯

另一方面,青云 QingCloud 在大数据领域已经陆续推出 Spark、Hadoop、Storm、HBase、ZooKeeper、Hive、SparkMR、QingMR 等一系列大数据服务,能为企业提供计

五嘎子 2020-05-29   1686   0

介绍6个不同类型的开源协作管理系统 资讯

Lily以NoSQL技术为主题,是建立在云计算上的内容仓库(content repository)。它是基于Apache的 HBase(存储)和Solr(索引/搜索),并提供了大型内容集合存储与检索的解决方案。可运用在门户网站,内

jopen 2012-07-14   9663   0

如何定义NoSQL 资讯

非正式的会议 上。与会人员来自 Voldemort, Cassandra, Dynomite, HBase, Hypertable, CouchDB, VPork, 以及 MongoDB 的公司。这个词

openkk 2012-02-15   23708   0
NOSQL  
1 2 3 4 5 6 7 8 9 10