分布式大规模数据库系统 HadoopDB 简介 经验

领导的开发团队利用不同的组件,包括开源数据库、 PostgreSQL 、 Apache Hadoop 数据分类技术和 Hive ( Facebook 公司开发的内部 Hadoop 项目)开发出的新型数据库。 HadoopDB 的查询是利用

fmms 2012-01-28   45083   0

手把手教你配置Hbase完全分布式环境 经验

配置相对比较简单,下面的教程也是基于我上面 2 篇 Hadoop 配置的环境下继续往下添加 HBase 的分布式配置,这次我的 HBase 安装目录放在跟 Hadoop 同一目录下面,节点信息跟我前一篇 Hadoop 完全分布式配置完全一样,不清楚的话可以参考我那篇文章。

jopen 2014-11-24   40063   0

Hive SQL 监控系统 - Hive Falcon 经验

1.概述 在开发工作当中,提交 Hadoop 任务,任务的运行详情,这是我们所关心的,当业务并不复杂的时候,我们可以使用 Hadoop 提供的命令工具去管理 YARN 中的任务。在编写 Hive SQL

BiancaCongr 2016-10-08   13047   0

Apache Drill 1.0发布 资讯

虽然大数据往往将关系型数据库当作靶子,但事实上真正生产环境的Hadoop和Spark等大数据平台,每天大部分工作仍然是为SQL查询提供服务,所以,SQL on Hadoop就成了竞争最激烈的技术领域。 5月19日,Apache基金会

jopen 2015-05-20   10665   0
P13

  2、Cloudera Manager 安装和环境熟悉 文档

Manager (简称CM)用于管理CDH4集群,可进行节点安装、配置、服务配置等,提供Web窗口界面提高了Hadoop配置可见度,而且降低了集群参数设置的复杂度。 https://ccp.cloudera.com

lxj2008 2014-01-17   427   0

ssh免密码登录 经验

io/blog/20160210/ssh-no-password-login/ 由于最近在学习hadoop, 需要ssh免密码登录, 所以学习了一下ssh免密码安装. 在这里记录一下ssh免密码登录的方法和使用场合

xvbaiqing 2016-02-11   16317   0
SSH   Linux  

Spark成为大数据分析领域新核心的五个理由 资讯

为了更为顺畅地实现Hadoop基础之上的高级与实时分析目标,Apache Spark凭借着自身的出色表现很快成为大数据领域的新核心。 在过去几年当中,随着Hadoop逐步成为大数据处理领域的主导性

jopen 2015-03-20   16135   0
Spark  

Pig用户自定义函数(UDF) 经验

通过register命令将这个jar文件注册到pig环境: register/home/user/hadoop_jar/pigudf.jar //参数为jar文件的本地路径 此时,我们就可以用以下语句调用这个函数:

jopen 2014-01-28   18429   0

超越线程池:Java并发并没有你想的那么糟糕 经验

没有机会把过多的注意力都放在上面。在这篇文章中,我们将带您了解Java 8 streams、 Hadoop、 Apache Spark、 Quasar fibers以及响应式编程,让你迅速入门。尤其是

jopen 2015-03-24   17806   0
P14

  HDFS资料整理 文档

中的mkdirs()方法,这个方法在DFSClient实例中调用同名方法mkdirs(),通过Hadoop本身的RPC机制调用Namenode的mkdirs()方法,最终这个调用PUSH到FSName

kspengjun 2011-07-26   3814   0
P12

  数据挖掘算法介绍 文档

Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive

racy 2012-03-25   678   0
P3

  大数据分析的流程浅析之一:大数据采集过程分析 文档

现分布式计算的软件有很多,名气最大的,目前市场上应用最广的,就是hadoop技术了,更精确地说应该是叫hadoop框架。 hadoop框架由多种功能性软件组成,其自身只是搭建一个和操作系统打交道的平台

czh_3104 2015-07-06   608   0

2012 年十大最成功开源项目 资讯

第一個是 Apache Hadoop , 海量數據(Big Data)革命掀起的浪潮,帶動了數據分析行業的增長,要在網路上處理這種規模的資料,目前比較經常被使用的平台就是Hadoop,而Facebook就

jopen 2013-01-14   6642   0
开源  

汲取Linux灵感,Pivotal开源大数据套件 资讯

Pivotal 公司 CTO 兼移动事务副总裁 SundeepMadra 指出,ODP 计划将努力在 Hadoop 领域重现 Linux 当初在 Unix 领域所完成的壮举:汇聚起一股统一化力量,从而以更为便捷的方式帮助企业客户实现方案采纳。

码头工人 2015-02-26   5986   0
Linux  

Myriad项目: Mesos和YARN 协同工作 资讯

第一个集群是Apache Hadoop,它相当于一个岛,它的资源全部用于Hadoop平台和它的进程。第二个集群就是除了Hadoop之外其它所有资源所在的集群。 之所以产生这种情况是由于Hadoop是用 Apache

n7w77 2015-03-19   6531   0
YARN  

Airbnb架构要点分享 经验

原文 http://www.infoq.com/cn/news/2015/09/Airbnb-Hadoop Airbnb 成立于2008年8月,总部位于加利福尼亚州旧金山市。Airbnb是一个值得

jopen 2015-09-22   22226   0

21 个最好的免费开源数据库 资讯

writing complex JavaScript code. 4. Hadoop (HBase) Hadoop is the name brand in big data. It is also

jopen 2013-12-26   33330   0

18种常见数据挖掘算法小结 经验

/article/details/43311943 11.K-Means(K均值)算法。K-Means算法是聚类算法,k在在这里指的是分类的类型数,所以在开始设定的时候非常关键,算法的原理是首先假

jopen 2015-03-05   184956   0
算法  

流行的机器学习算法概述 经验

由建模方式分类的。所有的聚类方法都是用统一的数据结构来组织数据,使得每组内有最多的共同点。 K-Means Expectation Maximisation (EM) Association Rule

maysut 2016-02-20   44504   0

计算机视觉、机器学习相关领域论文和源代码大集合 经验

] · FASTANN and FASTCLUSTER for approximate k-means (AKM)[ Project ] · Fast Intersection / Additive

jopen 2014-10-21   33976   0
1 2 3 4 5 6 7 8 9 10