数据库老兵:大数据时代 NoSQL 不是颠覆性技术 资讯

那么,什么才是大数据时代的颠覆性技术呢,Kertzman认为hadoop是个真正的机遇,但Hadoop的问题是企业部署过慢,而SQL-on-Hadoop则是大数据厂商为了加快Hadoop部署选择的技术路径。 文章来自 IT经理网

jopen 2013-11-11   13891   0
NOSQL  

MemSQL 4提供社区版本,并支持地理空间智能以及与Spark集成 资讯

,支持关系型、JSON及地理空间数据等不同数据格式的实时内存数据处理。此外,它还支持与 Apache Spark 、Hadoop分布式文件系统( HDFS )及 Amazon S3 集成。 该数据库解决方案可以用于更高

jopen 2015-06-03   8006   0
MemSQL  

简单的实时大规模机器学习基础架构:Oryx 经验

Oryx的目标是帮助Hadoop用户搭建并部署能够实时查询的机器学习模型,例如垃圾邮件过滤和推荐引擎。随着数据的不断流入,Oryx还将支持自我更新。 无论从建模还是部署,Oryx都可以随需扩展

jopen 2014-03-01   24541   0
P4

  一个hive hbase hdoop+eclipse的实例 文档

hbase,hive,hadoop一个演示的例子。 1. 在终端上创建表;(hive) CREATE EXTERNAL TABLE MYRELATION( key INT, name STRING,telphone1

xnbw 2016-01-11   472   0
P10

  MapReduce 数据分析实战 文档

/bin/hadoop fs -copyFromLocal test.log /hdfs/ 三、运行map red /bin/hadoop jar contrib/streaming/hadoop-streaming-0

gppxm 2012-10-19   449   0

非常不错的NoSQL 数据库学习资料汇总 问答

应运而生,提供了相应的解决方案。本学习路线图向 Java 开发人员介绍了 NoSQL 技术,以及 Apache Hadoop MapReduce 技术在处理大规模数据方面的优势。 1. NoSQL 入门

jopen 2011-11-09   24320   3
数据库   C/C++   Go   NOSQL   IDE  

Apache HBase v1.0 发布 资讯

HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase 是Google

jopen 2015-02-25   17855   0
HBase  

数据仓库平台,Apache Hive 1.1.0 发布 资讯

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2015-03-09   12022   0

Apache Accumulo 1.7.0 发布,K/V 存储方案 资讯

Key-Value 存储解决方案。Accumulo的设计也来自Google的BigTable,实现基于Hadoop、Zookeeper和Thrift。所以它与HBase很像,但也 有不少创新点,比如基于cel

jopen 2015-05-20   9229   0

云数据迁移移工具 Sqoop 1.4.0-incubating 发布 资讯

Sqoop是一个用来将 Hadoop 和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导入到Hadoop的HDFS中,也可以

fmms 2011-11-29   20318   1
Hadoop  

Apache HBase 0.96.0 发布:大变革和大量修复 资讯

数据类型的灵活性 模块化 更多详情: full announcement 。 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC

jopen 2013-10-24   19615   0

高效和分布式的通用数据处理平台:Apache Flink 经验

runs independently from Hadoop, but integrates seamlessly with YARN (Hadoop's next-generation scheduler)

jopen 2014-08-28   41962   0

数据仓库平台 Apache Hive 0.8.0 发布 资讯

Hive 是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

jopen 2011-12-19   15283   0
Hive  

数据仓库平台 Apache Hive 0.8.1 发布 资讯

Hive 是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

fmms 2012-02-05   11519   0
Hive  
P39

  腾讯TDW分布式数据仓库用户手册 文档

1安装客户端 首先获得客户端软件,然后解压安装包(以下用$HADOOP_HOME代替hadoop客户端解压后的路径): $ tar -xzvf hadoop-0.20.1-tdw-0.1-lite.tar.gz

gtimehero 2013-01-04   1102   1

JavaScript机器学习之线性回归 经验

function f(s) { return parseFloat(s); } 4. 训练数据并预测 编写 performRegression 函数: // 使用线性回归算法训练数据 function

吴青强 2017-07-02   29633   0

教程:用Python从零开始实现K近邻算法 经验

kNN算法的模型就是整个训练数据集。当需要对一个未知数据实例进行预测时,kNN算法会在训练数据集中搜寻k个最相似实例。对k个最相似实例的属性进行归纳,将其作为对未知实例的预测。 相似性度量依赖于数据类型。对于实数,可

rehrhh 2017-03-03   17406   0
P11

  HBase 存储架构 文档

以设置这个标志:Put.writeToWAL(boolean)。WAL log文件是一个标准的Hadoop SequenceFile(现在还在讨论是否应该把文件格式改成一个更适合HBase的格式)。在

dutianmin 2012-08-27   4513   0

大数据分析查询引擎Impala 资讯

Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数 据。已有的Hive系统虽然也提供了SQL语义,但由于Hi

jopen 2015-11-09   51967   1
Impala  

开发人员生产力状态 资讯

抓住“表现”所蕴含的主旨,Rebel Labs 加权了不同实践和工具在软件 质量 和版本发布的 可预测性 上的效果。 以下是研究报告中用于度量的一些实践: 对技术债务(Technical debt)的处理

jopen 2014-09-15   5464   0
1 2 3 4 5 6 7 8 9 10