开源项目,开源代码,开源文档,开源新闻,开源社区

领导的开发团队利用不同的组件，包括开源数据库、 PostgreSQL 、 Apache Hadoop 数据分类技术和 Hive （ Facebook 公司开发的内部 Hadoop 项目）开发出的新型数据库。 HadoopDB 的查询是利用

fmms 2012-01-28 45083 0

数据库服务器 NOSQL

配置相对比较简单，下面的教程也是基于我上面 2 篇 Hadoop 配置的环境下继续往下添加 HBase 的分布式配置，这次我的 HBase 安装目录放在跟 Hadoop 同一目录下面，节点信息跟我前一篇 Hadoop 完全分布式配置完全一样，不清楚的话可以参考我那篇文章。

jopen 2014-11-24 40063 0

NoSQL数据库 HBase

1.概述在开发工作当中，提交 Hadoop 任务，任务的运行详情，这是我们所关心的，当业务并不复杂的时候，我们可以使用 Hadoop 提供的命令工具去管理 YARN 中的任务。在编写 Hive SQL

BiancaCongr 2016-10-08 13047 0

HiveQL SQL 分布式/云计算/大数据

虽然大数据往往将关系型数据库当作靶子，但事实上真正生产环境的Hadoop和Spark等大数据平台，每天大部分工作仍然是为SQL查询提供服务，所以，SQL on Hadoop就成了竞争最激烈的技术领域。 5月19日，Apache基金会

jopen 2015-05-20 10665 0

Apache Drill

P13

Manager （简称CM）用于管理CDH4集群，可进行节点安装、配置、服务配置等，提供Web窗口界面提高了Hadoop配置可见度，而且降低了集群参数设置的复杂度。 https://ccp.cloudera.com

lxj2008 2014-01-17 427 0

分布式/云计算/大数据 x86 SQL

io/blog/20160210/ssh-no-password-login/ 由于最近在学习hadoop, 需要ssh免密码登录, 所以学习了一下ssh免密码安装. 在这里记录一下ssh免密码登录的方法和使用场合

xvbaiqing 2016-02-11 16317 0

SSH Linux

为了更为顺畅地实现Hadoop基础之上的高级与实时分析目标，Apache Spark凭借着自身的出色表现很快成为大数据领域的新核心。在过去几年当中，随着Hadoop逐步成为大数据处理领域的主导性

jopen 2015-03-20 16135 0

Spark

通过register命令将这个jar文件注册到pig环境： register/home/user/hadoop_jar/pigudf.jar //参数为jar文件的本地路径此时，我们就可以用以下语句调用这个函数：

jopen 2014-01-28 18429 0

Pig 分布式/云计算/大数据

没有机会把过多的注意力都放在上面。在这篇文章中，我们将带您了解Java 8 streams、 Hadoop、 Apache Spark、 Quasar fibers以及响应式编程，让你迅速入门。尤其是

jopen 2015-03-24 17806 0

React.js Java开发

P14

中的mkdirs（）方法，这个方法在DFSClient实例中调用同名方法mkdirs（），通过Hadoop本身的RPC机制调用Namenode的mkdirs（）方法，最终这个调用PUSH到FSName

kspengjun 2011-07-26 3814 0

Hadoop 分布式/云计算/大数据

P12

Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法：C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive

racy 2012-03-25 678 0

数据挖掘

P3

现分布式计算的软件有很多，名气最大的，目前市场上应用最广的，就是hadoop技术了，更精确地说应该是叫hadoop框架。 hadoop框架由多种功能性软件组成，其自身只是搭建一个和操作系统打交道的平台

czh_3104 2015-07-06 608 0

分布式/云计算/大数据

第一個是 Apache Hadoop ，海量數據(Big Data)革命掀起的浪潮，帶動了數據分析行業的增長，要在網路上處理這種規模的資料，目前比較經常被使用的平台就是Hadoop，而Facebook就

jopen 2013-01-14 6642 0

开源

Pivotal 公司 CTO 兼移动事务副总裁 SundeepMadra 指出，ODP 计划将努力在 Hadoop 领域重现 Linux 当初在 Unix 领域所完成的壮举：汇聚起一股统一化力量，从而以更为便捷的方式帮助企业客户实现方案采纳。

码头工人 2015-02-26 5986 0

Linux

第一个集群是Apache Hadoop，它相当于一个岛，它的资源全部用于Hadoop平台和它的进程。第二个集群就是除了Hadoop之外其它所有资源所在的集群。之所以产生这种情况是由于Hadoop是用 Apache

n7w77 2015-03-19 6531 0

YARN

原文 http://www.infoq.com/cn/news/2015/09/Airbnb-Hadoop Airbnb 成立于2008年8月，总部位于加利福尼亚州旧金山市。Airbnb是一个值得

jopen 2015-09-22 22226 0

Airbnb 软件架构

writing complex JavaScript code. 4. Hadoop (HBase) Hadoop is the name brand in big data. It is also

jopen 2013-12-26 33330 0

数据库

/article/details/43311943 11.K-Means(K均值)算法。K-Means算法是聚类算法，k在在这里指的是分类的类型数，所以在开始设定的时候非常关键，算法的原理是首先假

jopen 2015-03-05 184956 0

算法

由建模方式分类的。所有的聚类方法都是用统一的数据结构来组织数据，使得每组内有最多的共同点。 K-Means Expectation Maximisation (EM) Association Rule

maysut 2016-02-20 44504 0

数据挖掘算法

] · FASTANN and FASTCLUSTER for approximate k-means (AKM)[ Project ] · Fast Intersection / Additive

jopen 2014-10-21 33976 0

机器学习

分布式大规模数据库系统 HadoopDB 简介经验

手把手教你配置Hbase完全分布式环境经验

Hive SQL 监控系统 - Hive Falcon 经验

Apache Drill 1.0发布资讯

2、Cloudera Manager 安装和环境熟悉文档

ssh免密码登录经验

Spark成为大数据分析领域新核心的五个理由资讯

Pig用户自定义函数（UDF）经验

超越线程池：Java并发并没有你想的那么糟糕经验

HDFS资料整理文档

数据挖掘算法介绍文档

大数据分析的流程浅析之一：大数据采集过程分析文档

2012 年十大最成功开源项目资讯

汲取Linux灵感，Pivotal开源大数据套件资讯

Myriad项目: Mesos和YARN 协同工作资讯

Airbnb架构要点分享经验

21 个最好的免费开源数据库资讯

18种常见数据挖掘算法小结经验

流行的机器学习算法概述经验

计算机视觉、机器学习相关领域论文和源代码大集合经验

K-means Hadoop 的相关搜索

关键词

分布式大规模数据库系统 HadoopDB 简介 经验

手把手教你配置Hbase完全分布式环境 经验

Hive SQL 监控系统 - Hive Falcon 经验

Apache Drill 1.0发布 资讯

2、Cloudera Manager 安装和环境熟悉 文档

ssh免密码登录 经验

Spark成为大数据分析领域新核心的五个理由 资讯

Pig用户自定义函数（UDF） 经验

超越线程池：Java并发并没有你想的那么糟糕 经验

HDFS资料整理 文档

数据挖掘算法介绍 文档

大数据分析的流程浅析之一：大数据采集过程分析 文档

2012 年十大最成功开源项目 资讯

汲取Linux灵感，Pivotal开源大数据套件 资讯

Myriad项目: Mesos和YARN 协同工作 资讯

Airbnb架构要点分享 经验

21 个最好的免费开源数据库 资讯

18种常见数据挖掘算法小结 经验

流行的机器学习算法概述 经验

计算机视觉、机器学习相关领域论文和源代码大集合 经验