开源项目,开源代码,开源文档,开源新闻,开源社区

P8

1 目的 2 2 概述 2 3 前提 3 4 Web界面 3 5 Shell命令 3 5.1 分布式文件系统管理命令（DFSAdmin Command） 3 6 Secondary NameNode 4

coco0218 2013-07-11 3059 0

分布式/云计算/大数据

P8

1 目的 2 2 概述 2 3 前提 3 4 Web界面 3 5 Shell命令 3 5.1 分布式文件系统管理命令（DFSAdmin Command） 3 6 Secondary NameNode 4

chenfeng_0829 2013-04-17 2826 0

分布式/云计算/大数据

不仅现在Hadoop是企业大数据的标准，而且在未来，它的地位似乎一时难以动摇。谷歌文件系统与MapReduce 我们先来探讨一下Hadoop的灵魂——MapReduce。面对数据的爆炸性增

jopen 2015-01-10 10742 0

Hadoop

点数据进行缓存，减少这些数据的访问路径，提高用户体验。缓存实现常见的方式是本地缓存、分布式缓存。当然还有CDN、反向代理等，这个后面再讲。本地缓存，顾名思义是将数据缓存在应用服务器本地，可以存在内存

jopen 2014-09-27 19023 0

系统架构

来，不仅现在Hadoop是企业大数据的标准，而且在未来，它的地位似乎一时难以动摇。谷歌文件系统与MapReduce 我们先来探讨一下Hadoop的灵魂——MapReduce。面对数据的爆炸性

jopen 2014-08-05 27938 0

Hadoop 分布式/云计算/大数据

P7

一、工程前期工作 1、关于用户调研用户调研的目的是收集需求；用户调研的方法是直接面对面与用户交流，最好能亲身体验用户工作开展的过程，注重了解工作的细节。用户调研的结束标志是完成了需求分析设计文档，并且得到用

mousefat 2012-04-20 334 0

度、光照和所处节气的综合分析这些数据来源于多元化的“非结构”类型，并且数据量较大，只不过这些数据输入到的不是电脑，而是人脑并最终通过计算分析得出结论。 Google分布式计算的三驾马车 Google

jopen 2014-12-12 66149 0

大数据分布式/云计算/大数据

度、光照和所处节气的综合分析这些数据来源于多元化的“非结构”类型，并且数据量较大，只不过这些数据输入到的不是电脑，而是人脑并最终通过计算分析得出结论。 Google分布式计算的三驾马车 Google

jopen 2015-03-11 33285 0

大数据分布式/云计算/大数据

P18

湿度、光照和所处节气的综合分析这些数据来源于多元化的“非结构”类型，并且数据量较大，只不过这些数据输入到的不是电脑，而是人脑并最终通过计算分析得出结论。 Google分布式计算的三驾马车 · Google

guet_lee 2017-01-12 1828 0

分布式/云计算/大数据方案 SQL Go

顺便说一句，Spark不需要HDFS。不过，分布式文件系统依然有用。对Cloudera的Impala来说，商业智能是一种理想的使用场合;而分布式列式存储系统Kudu针对商业智能进行了优化。Spa

jopen 2016-02-16 35271 0

Hadoop Spark

Cache：负责分布式缓存搜索结果数据，从而缩短响应时间，提高前端系统的吞吐量。此外，为了一淘团队的运营效率，我们还在构建一套“从收集Query和Click日志开始，进行数据统计、关联分析、异常报警和

jopen 2015-03-24 30725 0

架构软件架构

P24

Detection相关工作 FastUnfolding算法基于GraphX实现总结 4. 相关工作-算法调研GN AlgorithmGN算法[1]每次选择betweenness最大的边进行删除当节点数量较大

n2n3 2015-01-19 12743 0

H2O的核心是一个统计分析引擎，它使用Hadoop的分布式文件系统（HDFS）作为其存储平台，但是它们的最终目标是像谷歌的BigQuery一样简单。H 2 O的用户交互是通过一个简单的网络搜索和标准R统计分析语法。另外，用户还可以在Microsoft

jopen 2013-11-19 29336 0

H2O

编者按 Hadoop于2006年1月28日诞生，至今已有10年，它改变了企业对数据的存储、处理和分析的过程，加速了大数据的发展，形成了自己的极其火爆的技术生态圈，并受到非常广泛的应用。在2016年H

jopen 2016-01-29 9843 0

Hadoop

Spark是近年来发展较快的分布式并行数据处理框架，可以与Hadoop联合使用，增强Hadoop的性能。同时，Spark还增加了内存缓存、流数据处理、图数据处理等更为高级的数据处理能力。这里简单介绍了

jopen 2015-06-25 53456 0

Spark 分布式/云计算/大数据

P16

报告内容1、选题来源及研究的意义 2、国内外研究现状及分析 3、主要研究内容 4、研究方案及进度安排 3. 1、选题来源及研究的目的和意义来源863 项目计划 分布式密文全文检索系统关键技术研究 ( 国家863计划项目

gonow86 2013-01-30 564 0

方案报告 Go

Mesos 将CPU、内存、存储介质以及其它计算机资源从物理机或者虚拟机中抽象出来，构建支持容错和弹性的分布式系统，并提供高效的运行能力。Mesos使用与 Linux内核相同的系统构建原则，只是他们处在不同

jopen 2015-06-04 8823 0

Apache Mesos

P25

《Hadoop权威指南前三章中文版》《Hadoop开发者第二期发布版V3》《Hadoop分布式文件系统架构和源码分析报告.doc》《HDFS资料整理.doc》 2，适用场景 HDFS被调节以支持大文件

7at7 2011-04-27 3440 0

Hadoop 分布式/云计算/大数据

根据公司产品战略和市场需求规划公司的产品，为销售端提供有竞争力的产品； 2 、收集客户需求、把握产品及技术发展、分析竞争对手产品，确保公司产品和解决方案的综合竞争力； 3 、根据规划分解落实产品开发目标，规范

hot1128 2014-10-11 18389 1

前端开发 Java C/C++ Go jQuery

P39

4. 淘宝网站流量数据来源：www.alexa.com一次页面展示要访问后台数据几十次！一个报表需要分析几TB乃至百TB数据！ 5. 什么地方人最爱大闸蟹？淘宝数据(1)离线数据：39PB+， 2000+台Hadoop机群，

noblemoon 2012-03-21 4675 0

分布式/云计算/大数据方案 SQL

HDFS 用户指南(HDFS User Guide ) 0.21 中文版文档

HDFS 用户指南中文版文档

Hadoop的生命周期有多久？资讯

大型网站系统架构演化之路经验

Hadoop的辉煌还能延续多久？经验

大型信息系统工程建设经验总结文档

深入浅出解析大数据平台架构经验

多图技术贴：深入浅出解析大数据平台架构经验

深入浅出解析大数据平台架构文档

Hadoop/Spark生态圈里的新气象资讯

一淘网的系统架构经验

基于GraphX的社区发现文档

用于大数据的开源预测引擎：H2O 经验

Hadoop之父祝贺黄色小象的十岁生日快乐资讯

关于Spark的基本概念和特性简介经验

密文全文检索小文档管理文档

Apple使用Apache Mesos重建Siri后端服务资讯

Hadoop进阶文档

★★杭州招聘：架构师、开发(云计算、技术框架)、前端架构等问答

大数据解决之道 - 淘宝OceanBase开发组文档

MooseFS分布式文件系统调研分析的相关搜索

关键词

HDFS 用户指南(HDFS User Guide ) 0.21 中文版 文档

HDFS 用户指南中文版 文档

Hadoop的生命周期有多久？ 资讯

大型网站系统架构演化之路 经验

Hadoop的辉煌还能延续多久？ 经验

大型信息系统工程建设经验总结 文档

深入浅出解析大数据平台架构 经验

多图技术贴：深入浅出解析大数据平台架构 经验

深入浅出解析大数据平台架构 文档

Hadoop/Spark生态圈里的新气象 资讯

一淘网的系统架构 经验

基于GraphX的社区发现 文档