开源项目,开源代码,开源文档,开源新闻,开源社区

P2

Hive安装配置 1 前期准备 1.1 Hadoop-0.20.2安装完成 1.2 下载Hive：http://www.apache.org/dyn/closer.cgi/hive/。目前版本为0.6

bbs_jack 2011-03-22 3712 0

分布式/云计算/大数据 Java SQL

被有效的重复使用。Flink是可扩展的批处理和流式数据处理的数据处理平台，设计思想主要来源于Hadoop、MPP数据库、流式计算系统等，支持增量迭代计算。原理 Spark 1.4特点如下所示。

jopen 2015-07-16 34743 0

Spark

出更明智的决策。一、Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的，因为它假设计

jopen 2015-02-09 54075 0

工具分布式/云计算/大数据

更明智的决策。 Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的，因为它假设计

jopen 2014-04-16 33991 0

大数据

更明智的决策。一、Hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的，因为它假设计算

jopen 2013-04-06 304691 1

大数据

P14

了。我们要编写mapper和reducer，然后对代码进行编译打出 jar 包，提交到本地的 JVM 或者是 hadoop的集群上，最后获取结果，这个周期是非常耗时的。 3. Pig的强大之处就是他只要几行Pig

706394187 2015-05-23 2379 0

分布式/云计算/大数据 Java SQL

Sqoop：SQL-to-Hadoop 连接传统关系型数据库和 Hadoop 的桥梁把关系型数据库的数据导入到 Hadoop 系统 ( 如 HDFS HBase 和 Hive) 中；把数据从 Hadoop 系统里抽取并导出到关系型数据库里。

jopen 2016-01-20 13746 0

分布式/云计算/大数据

t，collect和save等。 Spark常见存储数据的格式是Key-Value，也就是Hadoop标准的Sequence File，但同时也听说支持类似Parquet这样的列存格式。Key-V

jopen 2014-11-18 37159 0

Spark 分布式/云计算/大数据

P28

时空行为分析，异常轨迹分析数据挖掘语义时空模型 1、针对位置的ST-Matching道路匹配算法 2、时空聚类、频繁轨迹挖掘、拥塞预测栅格时空模型 1、100M*100M栅格 2、数据量压缩10倍以上 3、后续分析加速5倍以上位置记录地图数据

w7d33 2014-10-06 3838 0

分布式/云计算/大数据方案 SQL Go

的运转和安全。云计算平台本身为大数据的存储和分析提供了很好的基础设施（如storage和Hadoop、Spark和Storm等分布式计算环境），但默认的云平台上并没有自带强大的机器学习和人工智能

ldw8806 2017-10-10 33239 0

数据挖掘人工智能分布式/云计算/大数据

秒）完成了 100TB 的数据排序，打破了 Apache Spark 的纪录 23.4 分钟，更早之前 Hadoop 的纪录是 72 分钟。用公共服务的方式提供计算资源潘基文为啥对阿里巴巴情有独钟？

jopen 2015-12-07 9939 0

阿里巴巴

P39

MemTable (Buffer & Sort) Immutable SSTable Files Hadoop Integration 18. Consistency Models一致性模型是程序员与系统之间交互的一个协议

levyliul 2011-08-20 570 0

Cassandra NoSQL数据库方案 Go Basic

Xignite 来的金融市场数据，从 HouseCanary 来的房地产数据，从 Remine 来的房产消息预测信息，从 AccuWeather 来的历史天气数据，以及从 Dow Jones 来的新闻归档信息，所有这些信息都已经在

jopen 2017-03-15 37414 0

Google

ngoDB丰富自己武器库以处理更多不同类型的业务提供了无限可能，内存存储引擎、事务存储引擎甚至Hadoop在未来都有可能接入进来。 WiredTiger存储引擎如果说插件式存储引擎API为MongoDB

jopen 2015-03-22 91600 0

MongoDB NoSQL数据库

Xignite 来的金融市场数据，从 HouseCanary 来的房地产数据，从 Remine 来的房产消息预测信息，从 AccuWeather 来的历史天气数据，以及从 Dow Jones 来的新闻归档信息，所有这些信息都已经在

jopen 2017-03-15 38844 0

Google

P40

到！ 8. Hadoop Vs. Spark适用范围大比拼1. Hadoop Vs. Spark Hadoop/MapReduce和Spark最适合的都是做离线型的数据分析，但Hadoop特别适合是单

cador 2017-03-13 721 0

分布式/云计算/大数据方案 Apache Java Go

P5

Inc的一个产品，号称下一代Hadoop，使Hadoop变为一个速度更快、可靠性更高、更易于管理、使用更加方便的分布式计算服务和存储平台，同时性能也不断提高。它将极大的扩大了Hadoop的使用范围和方式。它包

sweetbaybe 2012-12-24 2387 0

分布式/云计算/大数据

IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration;

jopen 2014-12-04 89164 0

HBase Solr 搜索引擎

/details/50570518 在Hadoop中执行的任务有时候需要把多个Map/Reduce作业连接到一起，这样才能够达到目的。[1]在Hadoop生态圈中，有一种相对比较新的组件叫做Ooz

ltww3128 2016-01-23 82306 0

分布式/云计算/大数据

P9

其中，PC-1做namenode节点，PC-2、PC-3和PC-4做datanode节点。并且已经安装成功Hadoop-0.20.1及以上版本。安装包准备需要安装包： zookeeper-3.2.1.tar.gz（stable版本）

wan4u 2012-03-23 3857 0

分布式/云计算/大数据

Hive安装配置文档

Spark与Flink：对比与分析资讯

6个用于大数据分析的最好工具经验

6个用于大数据处理分析的最好工具资讯

6个用于大数据分析的最好工具资讯

Pig 介绍文档

大数据(八) - Sqoop 经验

内存计算技术那家强？SPARK vs HANA 经验

电信场景下Spark一站式分析平台文档

五分钟了解你不得不知道的人工智能热门词汇经验

为了减少3个鸡蛋的能耗阿里巴巴工程师做了10年资讯

Cassandra简介文档

2017谷歌云大会，一口气发布100+消息资讯

MongoDB 3.0新增特性一览经验

2017谷歌云大会，一口气发布100+消息资讯

spark--高效的分布式计算架构文档

MapR 初体验文档

基于Solr的HBase多条件查询测试经验

Oozie4.2.0配置安装实战经验

HBase 的安装、配置、管理与编程文档

hadoop 电影票房预测的相关搜索

关键词

Hive安装配置 文档

Spark与Flink：对比与分析 资讯

6个用于大数据分析的最好工具 经验

6个用于大数据处理分析的最好工具 资讯

6个用于大数据分析的最好工具 资讯

Pig 介绍 文档

大数据(八) - Sqoop 经验

内存计算技术那家强？SPARK vs HANA 经验

电信场景下Spark一站式分析平台 文档

五分钟了解你不得不知道的人工智能热门词汇 经验

为了减少3个鸡蛋的能耗 阿里巴巴工程师做了10年 资讯

Cassandra简介 文档

2017谷歌云大会，一口气发布100+消息 资讯

MongoDB 3.0新增特性一览 经验

2017谷歌云大会，一口气发布100+消息 资讯

spark--高效的分布式计算架构 文档

MapR 初体验 文档

基于Solr的HBase多条件查询测试 经验

Oozie4.2.0配置安装实战 经验

HBase 的安装、配置、管理与编程 文档

hadoop 电影票房预测 的相关搜索

关键词

Hive安装配置文档

Spark与Flink：对比与分析资讯

6个用于大数据分析的最好工具经验

6个用于大数据处理分析的最好工具资讯

6个用于大数据分析的最好工具资讯

Pig 介绍文档

电信场景下Spark一站式分析平台文档

五分钟了解你不得不知道的人工智能热门词汇经验

为了减少3个鸡蛋的能耗阿里巴巴工程师做了10年资讯

Cassandra简介文档

2017谷歌云大会，一口气发布100+消息资讯

MongoDB 3.0新增特性一览经验

2017谷歌云大会，一口气发布100+消息资讯

spark--高效的分布式计算架构文档

MapR 初体验文档

基于Solr的HBase多条件查询测试经验

Oozie4.2.0配置安装实战经验

HBase 的安装、配置、管理与编程文档

hadoop 电影票房预测的相关搜索