P2

  Hive安装配置 文档

Hive安装配置 1 前期准备 1.1 Hadoop-0.20.2安装完成 1.2 下载Hive:http://www.apache.org/dyn/closer.cgi/hive/。目前版本为0.6

bbs_jack 2011-03-22   3712   0

Spark与Flink:对比与分析 资讯

被有效的重复使用。Flink是可扩展的批处理和流式数据处 理的数据处理平台,设计思想主要来源于Hadoop、MPP数据库、流式计算系统等,支持增量迭代计算。 原理 Spark 1.4特点如下所示。

jopen 2015-07-16   34743   0
Spark  

6个用于大数据分析的最好工具 经验

出更明智的决策。 一、Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计

jopen 2015-02-09   54075   0

6个用于大数据处理分析的最好工具 资讯

更明智的决策。 Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计

jopen 2014-04-16   33991   0

6个用于大数据分析的最好工具 资讯

更明智的决策。 一、Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算

jopen 2013-04-06   304691   1
P14

  Pig 介绍 文档

了。我们要编写mapper和reducer,然后对代码进行编译打出 jar 包,提交到本地的 JVM 或者是 hadoop的集群 上,最后获取结果,这个周期是非常 耗时 的。 3. Pig的强大之处 就是他只要 几行Pig

706394187 2015-05-23   2379   0

大数据(八) - Sqoop 经验

Sqoop:SQL-to-Hadoop 连接 传统关系型数据库 和 Hadoop 的桥梁 把关系型数据库的数据导入到 Hadoop 系统 ( 如 HDFS HBase 和 Hive) 中; 把数据从 Hadoop 系统里抽取并导出到关系型数据库里。

jopen 2016-01-20   13746   0

内存计算技术那家强?SPARK vs HANA 经验

t,collect和save等。 Spark常见存储数据的格式是Key-Value,也就是Hadoop标准的Sequence File,但同时也听说支持类似Parquet这样的列存格式。Key-V

jopen 2014-11-18   37159   0
P28

  电信场景下Spark一站式分析平台 文档

时空行为分析,异常轨迹分析数据挖掘语义时空模型 1、针对位置的ST-Matching道路匹配算法 2、时空聚类、频繁轨迹挖掘、拥塞预测 栅格时空模型 1、100M*100M栅格 2、数据量压缩10倍以上 3、后续分析加速5倍以上 位置记录地图数据

w7d33 2014-10-06   3838   0

五分钟了解你不得不知道的人工智能热门词汇 经验

的运转和安全。 云计算平台本身为大数据的存储和分析提供了很好的基础设施(如storage和Hadoop、Spark和Storm等分布式计算环境),但默认的云平台上并没有自带强大的机器学习和人工智能

为了减少3个鸡蛋的能耗 阿里巴巴工程师做了10年 资讯

秒)完成了 100TB 的数据排序,打破了 Apache Spark 的纪录 23.4 分钟,更早之前 Hadoop 的纪录是 72 分钟。 用公共服务的方式提供计算资源 潘基文为啥对阿里巴巴情有独钟?

jopen 2015-12-07   9939   0
P39

  Cassandra简介 文档

MemTable (Buffer & Sort) Immutable SSTable Files Hadoop Integration 18. Consistency Models一致性模型是程序员与系统之间交互的一个协议

levyliul 2011-08-20   570   0

2017谷歌云大会,一口气发布100+消息 资讯

Xignite 来的金融市场数据,从 HouseCanary 来的房地产数据,从 Remine 来的房产消息预测信息,从 AccuWeather 来的历史天气数据,以及从 Dow Jones 来的新闻归档信息,所有这些信息都已经在

jopen 2017-03-15   37414   0
Google  

MongoDB 3.0新增特性一览 经验

ngoDB丰富自己武器库以处理更多不同类型的业务提供了无限可能,内存存储引擎、事务存储引擎甚至Hadoop在未来都有可能接入进来。 WiredTiger存储引擎 如果说插件式存储引擎API为MongoDB

jopen 2015-03-22   91600   0

2017谷歌云大会,一口气发布100+消息 资讯

Xignite 来的金融市场数据,从 HouseCanary 来的房地产数据,从 Remine 来的房产消息预测信息,从 AccuWeather 来的历史天气数据,以及从 Dow Jones 来的新闻归档信息,所有这些信息都已经在

jopen 2017-03-15   38844   0
Google  
P40

  spark--高效的分布式计算架构 文档

到! 8. Hadoop Vs. Spark适用范围大比拼1. Hadoop Vs. Spark Hadoop/MapReduce和Spark最适合的都是做离线型的数据分析,但Hadoop特别适合是单

cador 2017-03-13   721   0
P5

  MapR 初体验 文档

Inc的一个产品,号称下一代Hadoop,使Hadoop变为一个速度更快、可靠性更高、更易于管理、使用更加方便的分布式计算服务和存储平台,同时性能也不断提高。它将极大的扩大了Hadoop的使用范围和方式。它包

sweetbaybe 2012-12-24   2387   0

基于Solr的HBase多条件查询测试 经验

IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration;

jopen 2014-12-04   89164   0

Oozie4.2.0配置安装实战 经验

/details/50570518 在Hadoop中执行的任务有时候需要把多个Map/Reduce作业连接到一起,这样才能够达到目的。[1]在Hadoop生态圈中,有一种相对比较新的组件叫做Ooz

ltww3128 2016-01-23   82306   0
P9

  HBase 的安装、配置、管理与编程 文档

其中,PC-1做namenode节点,PC-2、PC-3和PC-4做datanode节点。 并且已经安装成功Hadoop-0.20.1及以上版本。 安装包准备 需要安装包: zookeeper-3.2.1.tar.gz(stable版本)

wan4u 2012-03-23   3857   0
1 2 3 4 5 6 7 8 9 10