开源项目,开源代码,开源文档,开源新闻,开源社区

谭政，Hulu 网大数据基础平台研发。曾在新浪微博平台工作过。专注于大数据存储和处理，对 Hadoop、HBase 以及 Spark 等等均有深入的了解。 Spark 最新的特性以及功能 2015 年中

jopen 2016-01-07 42951 0

Spark 大数据

1，Hive0.14，Pig0.15.0，Maven3.2，JDK1.7，zookeeper3.4.6，HBase1.1.2，MySQL5.6 集群部署： node1~4.centos.com node1~4

ltww3128 2016-01-23 82306 0

分布式/云计算/大数据

取的数据也就非常少了。另外一个变种就是支持遍历的主键，比如hbase的rowkey。如果查询的是一个基于rowkey的范围，那么像hbase这样的数据库就可以支持只读取到这个范围内的数据，而不用读取不

jopen 2015-06-09 35005 0

数据检索

不需要，因为是内存数据库 Cassandra commit log data.db 需要，数据存在本地文件 HBase commit log HFile 需要，数据存在HDFS Kafka commit log commit

szz314159 2016-05-24 56223 0

Kafka 消息系统 NOSQL

分析：lucene是支持随机读写的，而hdfs只支持随机读。但是HBase可以来补救。HBase提供随机读写，来解决Hadoop不能处理的问题。HBase自底层设计开始即聚焦于各种可伸缩性问题：表可以很“高”

jopen 2014-12-12 31918 0

Hadoop 分布式/云计算/大数据

据分析，优化之前，老的系统需要用Impala和Hbase两个系统，建立4个二级索引才可以完成业务需要的性能。这其中，Impala用来做报表输出，Hbase做关键维度查询。这两个系统有各自存在不足：Im

AAFDell 2017-09-11 32989 0

Spark SQL 分布式/云计算/大数据

Cache Redis Memcached Leveldb Bigtable HBase Cassandra Mongodb 图数据库 neo4j 3.3.3. 参考资料

jopen 2015-12-08 213763 15

Java

P76

系统Hadoop Map ReduceHadoop HDFSDatax报表需求(淘数据)数据开发界面Hbase元数据中心和知识库…即席查询(adhoc)数据分析数据挖掘数据产品数据开发平台——产品架构数

hans511002 2012-06-24 4302 0

分布式/云计算/大数据方案培训 HTTP Java

newer alternative databases, with services like HBase, Cassandra and Teradata slowly gaining ground.

jopen 2014-09-09 21858 0

SQL NOSQL

1.0.1 & 2.4.0 Apache Cassandra 2.0.2 Apache HBase 0.94.14 Apache Accumulo 1.5.1 MongoDB 2.12.2

m4ed 2015-01-31 18141 0

Apache Nutch

is built on technologies Apache Spark , Apache HBase and Spray . It is a machine learning server that

jopen 2015-03-20 18977 0

推荐系统推荐引擎

自己进行内存管理，关键地方的内存对象的创建和释放Java内部自己控制，减少GC的压力（类似Hbase的Block Buffer Cache）。不使用WeakHashMap和全局锁，WeakHas

jopen 2014-12-23 13496 0

HERMES 搜索引擎

Apache Hadoop NoSql 数据库 – MongoDB , Cassandra , Hbase SQL 数据库 – MySql (Oracle), MariaDB , PostgreSQL

y37f 2015-03-15 37847 0

工具分布式/云计算/大数据

4.reduce阶段：主要任务是把所有的存储到hdfs货hbase种去。三。心得爬虫程序并不是hadoop典型应用场景。hadoop一般应用于海量数据

jopen 2013-12-26 84009 0

Hadoop 网络爬虫

搞数据开发的对一些产品非常熟悉，比如： HBase Hadoop … 但是对它们背后共同的“男人”没有太多的了解，太不应该了。这篇是一个基础的介绍，看完之后应该会对ZOOKEEPER有大概了解。安装部署

jopen 2015-12-22 15093 0

分布式/云计算/大数据 ZooKeeper

，一个元数据管理系统，此外还有一些常见的与 Hadoop 平台相结合使用的，Pig、Hive、HBase 及 Zookeeper 等。在接下来的几周里，Hortonworks 计划发布基于 Hadoop

openkk 2011-11-06 12989 1

Hadoop

Hadoop就成了竞争最激烈的技术领域。 5月19日，Apache基金会宣布针对Hadoop、NoSQL（MongoDB和HBase）和云存储（Amazon S3, Google Cloud Storage, Azure Blog

jopen 2015-05-20 10665 0

Apache Drill

另一方面，青云 QingCloud 在大数据领域已经陆续推出 Spark、Hadoop、Storm、HBase、ZooKeeper、Hive、SparkMR、QingMR 等一系列大数据服务，能为企业提供计

五嘎子 2020-05-29 1686 0

青云数据库分布式 PolonDB

Lily以NoSQL技术为主题，是建立在云计算上的内容仓库(content repository)。它是基于Apache的 HBase(存储)和Solr(索引/搜索)，并提供了大型内容集合存储与检索的解决方案。可运用在门户网站，内

jopen 2012-07-14 9663 0

协作管理系统

非正式的会议上。与会人员来自 Voldemort, Cassandra, Dynomite, HBase, Hypertable, CouchDB, VPork, 以及 MongoDB 的公司。这个词

openkk 2012-02-15 23708 0

NOSQL

大数据盘点之Spark篇资讯

Oozie4.2.0配置安装实战经验

影响数据检索效率的几个因素经验

Kafka技术内幕-日志压缩经验

Hadoop面试题,看看你能答对多少？答案在后面经验

关于CarbonData+Spark SQL的一些应用实践和调优经验分享经验

Java工程师成神之路~ 资讯

淘宝数据开发平台介绍文档

排名前10位的SQL和NoSQL数据库资讯

Java实现的网络爬虫，Apache Nutch v2.3 发布资讯

推荐系统大全Recommender Systems 经验

搜索引擎：HERMES 经验

大数据领域一些实用工具经验

基于hadoop 网络爬虫经验

ZOOKEEPER基础经验

Hortonworks宣布一款Hadoop数据平台资讯

Apache Drill 1.0发布资讯

青云QingCloud上线分布式关系型数据库PolonDB 资讯

介绍6个不同类型的开源协作管理系统资讯

如何定义NoSQL 资讯

HBase ͼƬ�洢的相关搜索

关键词

大数据盘点之Spark篇 资讯

Oozie4.2.0配置安装实战 经验

影响数据检索效率的几个因素 经验

Kafka技术内幕-日志压缩 经验

Hadoop面试题,看看你能答对多少？答案在后面 经验

关于CarbonData+Spark SQL的一些应用实践和调优经验分享 经验

Java工程师成神之路~ 资讯

淘宝数据开发平台介绍 文档

排名前10位的SQL和NoSQL数据库 资讯

Java实现的网络爬虫，Apache Nutch v2.3 发布 资讯