P13

  Hadoop官方文档0.18 文档

或者浏览一下存档邮件。 · Hadoop快速入门 · Hadoop集群搭建 · Hadoop分布式文件系统 · Hadoop Map-Reduce教程 · Hadoop本地库 · API参考 · 维基

pkuxiaoq 2011-05-31   519   0

HDFS文件操作 经验

HDFS是一种文件系统,存储着Hadoop应用将要处理的数据,类似于普通的Unix和linux文件系统,不同的是他是实现了google的GFS文件系统的思想,是适用于大规模分布式数据处理相关应用的、可扩展的分布式文件系统。它有以下优点:

fmms 2012-04-05   44619   0

从数据仓库系统对比看Hive发展前景 资讯

文 / 杨栋 大数据时代的信息爆炸,使得分布式/并行处理变得如此重要。无论是传统行业,还是新兴行业(特别是互联网行业),日常业务运行所产生的海量用户 和服务数据都需要更大的硬件资源来处理。需要并行

jopen 2012-05-30   18467   0
Hive  

Linux存储的未来 资讯

Vault 会议上,内容全部是关于 文件系统 和 存储 的。 你可能会觉得这两者中任一个都没有什么新的可讲,但是你可能错了。 像 Btrfs 一样的 Linux 文件系统 和 存储 支持的选择一直在改进。–

n7w77 2015-03-19   9799   0
Linux  

开源的DevOps开发工具箱 经验

redis/ruby 的实时事件跟踪应用,是个收集和可视化时间序列数据的框架,用户可以在几分钟内创建漂亮的实时分析仪表盘; Logster :是一个工具,读取日志文件然后创建 Graphite 或 Ganglia

jopen 2014-12-09   46194   0
DevOps  

Presto DB 简介 经验

ODBC 还不可用。 Presto 是由facebook开发的一个分布式SQL查询引擎, 它被设计为用来专门进行高速、实时的数据分析。它支持标准的ANSI SQL,包括复杂查询、聚合(aggregat

jopen 2015-11-21   19768   0

运维角度浅谈MySQL数据库优化 经验

#立刻生效 3.3 硬件配置 加大物理内存,提高文件系统性能。linux内核会从内存中分配出缓存区(系统缓存和数据缓存)来存放热数据,通过文件系统延迟写入机制,等满足条件时(如缓存区大小到达一定百分

jopen 2015-06-09   31894   0
P20

  软件系统实施方案 文档

运行支持 1. 调查分析 2. 制定项目实施建议书 3. 项目组建设 4. 业务调研 5. 制定工作任务书 6. 培训准备 7. 项目启动会 8. 系统安装测试 9. 项目组培训 10. 业务分析与设计 11

ralphone 2015-01-26   4174   0
方案  

收到微信宝马广告的都是土豪? 数据告诉你真相 资讯

昨天微信推出第一轮广告,分别是宝马,vivo 和可口可乐,三只广告分别发向不同的用户。据流传,此次的微信广告推送是基于大数据分析;腾讯人工智能对用户的识别分类如下:年收入 100 万以上的用户收到的是宝马广告;买不起 iPhone

jopen 2015-01-26   17831   0
微信  

Pregel:基于图分割的图结构数据并行处理 经验

node),采用分布式文件系统,例如:GFS(google 分布式文件系统),HDFS(Hadroop 分布式文件系统),TFS(淘宝分布式文件系统)等。域名服务器包含了分布式文件系统中文件名与文件地址之间的键值对索引(index)。

jopen 2014-01-18   14972   0

开源爬虫软件汇总 经验

由两部分组成:爬虫工作平台和WebSPHINX类包 Apache YaCy 基于P2P的分布式Web搜索引擎 GPL Python QuickRecon 具有查找子域名名称、收集电子邮件地址并寻找人际关系等功能

jopen 2014-10-23   49510   0
P37

  阿里大数据架构 文档

Service框架,并且引入spring 框架 Spring容器和Alibaba Service框架无缝集成 AO,BO 使用分布式cache缓存对象 数据访问层 透明的事务处理 引入Hibernate和iBatis,以iBatis为主2005-工业革命

pwgw 2016-02-04   867   0
P37

  大数据架构 文档

Service框架,并且引入spring 框架 Spring容器和Alibaba Service框架无缝集成 AO,BO 使用分布式cache缓存对象 数据访问层 透明的事务处理 引入Hibernate和iBatis,以iBatis为主2005-工业革命

WillZhao 2018-01-02   1549   0

HDFS NameNode内存全景 经验

NameNode管理着整个HDFS文件系统的元数据。从架构设计上看,元数据大致分成两个层次:Namespace管理层,负责管理文件系统中的树状目录结构以及文件与数据块的映射关系;块管理层,负责管理文件系统中文件的物理块与

KanHyatt 2016-08-31   16258   0

Google的十个核心技术 经验

分为四大类: 1.分布式基础设施:GFS,Chubby和Protocol Buffer。 2.分布式大规模数据处理:MapReduce和Sawzall。 3.分布式数据库技术:BigTable和数据库Sharding。

jopen 2012-12-06   74726   0
Google  

Facebook使用Corona提升Hadoop的可伸缩性 资讯

“值得注意的是,我们曾经考虑过将 Apache YARN 作为 Corona 的一种替代方案。然而,在调研了 YARN 在 我们的 HDFS 版本 (由于我们海量的 PB 级数据存储而产生的强烈需求)上的

jopen 2012-11-22   6643   0

【Hadoop】HDFS的运行原理 经验

File System )Hadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFS(Google File System)Google 文件系统( 中文 , 英文 )。 HDFS有很多特点

wdey 2015-05-24   13886   0

第2章 大型网站架构模式 经验

务分割开来,包装成高内聚低耦合的模块单元,一方面有助于软件的开发和维护;另一方面,便于不同模块的分布式部署,提高网站的并发处理能力和功能扩展能力。 大型网站分割的粒度可能会很小。比如:在应用层,将

jopen 2015-03-10   24888   0
架构  

Hypertable应用实践:比肩HBase 经验

Facebook Internal Metrics )。 Titan 主要用于用户数据存储, Puma 用于 MapReduce 分布式计算, ODS 用于存储公司内部监控数据, Facebook 基于 HBase 的应用方式与国内几大互联网公司类似。

jopen 2012-09-20   43535   0

Spark介绍 经验

lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点; 但不同于MapReduce的是Job中间

jopen 2014-11-17   109482   0
1 2 3 4 5 6 7 8 9 10