P27

  Hadoop数据分析 文档

Hadoop基本概念,Hadoop的应用范围,Hadoop底层实现原理,Hive与数据分析,Hadoop集群管理典型的Hadoop离线分析系统架构。

zhpboy 2013-10-12   4361   0

Java招聘 问答

搜索后端工程师 职位描述:负责分布式索引和搜索系统的开发 任职要求: 计算机相关专业,3年以上开发工作经验,本科 软件知识结构全面,算法基本功扎实,有良好的Java基础 有Solr & Lucene 的开发经验 熟悉SQL 语言,有MySQL的开发经验 有 Hadoop, NoSQL数据库等开发经验的优先 高度的工作热情和工作积极性,学习能力强,较强的责任心,良好的沟通能力

monica1018 2014-10-13   14698   0

Hadoop集群数据处理API:Cascading 经验

Cascading是一个架构在Hadoop上的API,用来创建复杂和容错数据处理工作流。它抽象了集群拓扑结构和配置来快速开发复杂分布式的应用,而不用考虑背后的MapReduce。

jopen 2011-12-22   28341   0

Hadoop数据传输工具:Sqoop 经验

Apache Sqoop(SQL-to-Hadoop) 项目旨在协助 RDBMS 与 Hadoop 之间进行高效的大数据交流。用户可以在 Sqoop 的帮助下,轻松地把关系型数据库的数据导入到 Hadoop 与其相关的系统 (如HBase和Hive)中;同时也可以把数据从 Hadoop 系统里抽取并导出到关系型数据库里。

jopen 2014-12-02   18913   0

Hadoop 中利用 mapreduce 读写 mysql 数据 经验

有时候我们在项目中会遇到输入结果集很大,但是输出结果很小,比如一些 pv、uv 数据,然后为了实时查询的需求,或者一些 OLAP 的需求,我们需要 mapreduce 与 mysql 进行数据的交互,而这些是 hbase 或者 hive 目前亟待改进的地方。

jopen 2013-07-29   35351   0
P45

  基于Hadoop的大数据应用分析 文档

基于Hadoop的大数据应用分析5.东软基于HADOOP的大数据应用建议内容提要1.大数据背景介绍2.HADOOP体系架构3.基于HADOOP的大数据产品分析4.基于HADOOP的大数据行业应用分析IDC定义:为了更为经济的从高频率获取的、大容量的、不同结构和类型的数据中获取价值,而设计的新一代架构和技术。大数据定义及特点大数据对系统的需求High performance–高并发读写的需求高并发、实时动态获取和更新数据HugeStorage–海量数据的高效率存储和访问的需求类似SNS网站,海量用户信息的高效率实时存储和查询

xcxc 2015-08-24   782   0

Hadoop数据传输工具sqoop 经验

sqoop是Apache顶级项目,主要用来在Hadoop和关系数据库中传递数据。通过sqoop,我们可以方便的将数据从关系数据库导入到HDFS,或者将数据从HDFS导出到关系数据库。

jopen 2013-12-28   25466   0

基于Hadoop数据收集系统 - Chukwa 经验

什么是 Chukwa,简单的说它是一个数据收集系统,它可以将各种各样类型的数据收集成适合 Hadoop 处理的文件保存在 HDFS 中供 Hadoop 进行各种 MapReduce 操作。Chukwa 本身也提供了很多内置的功能,帮助我们进行数据的收集和整理。

openkk 2012-02-27   44721   0

hadoop集群数据节点gmond安装 经验

hadoop集群数据节点gmond安装

jopen 2015-08-30   13932   0

hadoop与mysql数据库的那点事 经验

转眼间已经接触了hadoop两周了,从之前的极力排斥到如今的有点喜欢,刚开始被搭建hadoop开发环境搞得几乎要放弃,如今学会了编写小程序,每天都在成长一点挺好的,好好努力,为自己的装备库再填一件武器挺好的,学习在于坚持不懈,加油!!!

htwoz 2016-02-02   14801   0

细细品味大数据--初识hadoop 经验

之前在学校的时候一直就想学习大数据方面的技术,包括hadoop和机器学习啊什么的,但是归根结底就是因为自己太懒了,导致没有坚持多长时间, 加上一直为offer做准备,所以当时重心放在C++上面了(虽然C++也没怎么学),计划在大四下有空余时间再来慢慢学习。现在实习了,需要这方面的知 识,这对于我来说,除去校招时候投递C++职位有少许影响之外,无疑是有很多的好处。

jopen 2015-08-30   15444   0

超越 Hadoop,Luigi 打通云端大数据管道 资讯

新的大数据开源技术和工具往往来自互联网公司,除了Facebook、Google和Twitter这样的巨头外,一些甚至是你想不到的互联网公司,例如Netflix和Spotify(音乐流媒体服务)也会贡献一些优秀的大数据分析开源工具(Suro和Luigi)。

jopen 2014-10-14   8176   0
Hadoop  

Hadoop集群间的hbase数据迁移 经验

在日常的使用过程中,可能经常需要将一个集群中hbase的数据迁移到或者拷贝到另外一个集群中,这时候,可能会出很多问题

jopen 2012-09-04   508   0

如何挑选合适的大数据Hadoop平台? 经验

IBM、Oracle、SAP、甚至Microsoft等几乎所有的大型软件提供商都采用了Hadoop。然而,当你已经决定要使用Hadoop来处理大数据时,首先碰到的问题就是如何开始以及选择哪一种产品。本文讨论了不同的选择,并推荐了每种选择的适用场合。

jopen 2015-02-19   45764   0

Hive:基于hadoop数据仓库工具 经验

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为 MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应 用,十分适合数据仓库的统计分析。

jopen 2014-12-03   24098   0
P14

  hadoop数据仓库工具--hive介绍 文档

HIVE介绍简介,是什么hive是一个基于hadoop的数据仓库。使用hadoop-hdfs作为数据存储层;提供类似SQL的语言(HQL),通过hadoop-mapreduce完成数据计算;通过HQL语言提供使用者部分传统RDBMS一样的表格查询特性和分布式存储计算特性。

cooltaoism 2011-06-28   650   0

数据相关技术、Hadoop生态、LinkedIn内部实战 经验

大数据相关技术、Hadoop生态、LinkedIn内部实战

jopen 2015-01-26   192894   0

数据Hadoop之间是什么关系? 经验

大数据在近些年来越来越火热,人们在提到大数据遇到了很多相关概念上的问题,比如云计算、 Hadoop等等。那么,大数据是什么、Hadoop是什么,大数据和Hadoop有什么关系呢?

pm45e 2015-08-03   32007   0
P32

  基于hadoop数据仓库技术 文档

Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。

xcxc 2015-08-24   524   0
1 2 3 4 5 6 7 8 9 10