LinkedIn架构这十年 经验

流水化和队列化数据(streaming and queueing)。 比如, 我们需要将数据放入数据仓库,我们需要将一批数据放入Hadoop工作流以便分析,我们从每个服务中中聚合了大量日志, 我们收集了很多用户追踪事件如页面点击,

jopen 2015-08-08   22767   0
P22

  数据挖掘6章关联2 文档

第6章:从大数据库中挖掘关联规则关联规则挖掘 从交易数据库中挖掘一维的布尔形关联规则 从交易数据库中挖掘多层次关联规则 在交易数据库和数据仓库中挖掘多维关联规则 从关联挖掘到相关性分析 基于约束的关联挖掘 小结2001-11-62数据挖掘:概念和技术

kcde 2015-12-12   509   0

如何让Hadoop结合R语言做统计和大数据分析? 资讯

是基于Hadoop的一个 数据仓库 工具,可以将结构化的数据文件映射为一张数据库表,通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合 数据仓库 的统计分析。

jopen 2015-12-23   48265   0
Hadoop  
P27

  淘宝数据应用开发平台idata 文档

平台与工具的实现数据产品开发团队商业智能团队数据开发团队内部用户外部用户基础开发 & 开发架构……使用、建设建设如何使用数据——传统数据仓库模式 6. 数据分析师ETL开发工程师模型架构师运营程序员数据化运营 商业决策 产品设计理解业务

lxz 2014-01-03   2361   0
P31

  内存计算Spark和 SQL on Hadoop 文档

高性能,低延迟! 18. 安装配置与简介HIVEHIVE是什么 HIVE是一个在Hadoop上构建数据仓库的软件,它支z支持通过类SQL的HQL语言操作结构化的数据 Facebook的第一代Hadoop

pnx8 2014-08-17   756   0
P11

  软件开发人员职业生涯规划 文档

、SCM软件(供应链管理,即物流软件),银行证券软件,财务软件,电子商务/政务(包括各种网站),数据仓库,数据挖掘,商务智能等企业信息管理系统企业计算领域对人才的需求显然永远是数量最大的,因为这是计算机应用最多的领域。

詹氏归来 2012-04-18   6735   0
P63

  hive从入门到精通 文档

主要介绍 背景及体系结构 1背景 应用于工业的商务智能收集分析所需的数据集正在大量增长,使得传统的数据仓库解决方案变得过于昂贵。Hadoop 是一个流行的开源map-reduce实现,用于像yahoo,

rocflysi 2017-06-07   535   0
P150

  CRM-客户关系管理 文档

CRM理念:建立“以客户为核心、以市场为导向”经营管理模式。 CRM技术:Internet和电子商务、多媒体技术、数据仓库和数据挖掘、专家系统和人工智能、呼叫中心等等。 CRM实施:CRM软件不是一种交付即用的工具,需要根据组织的具体情况进行CRM实施。

108439162 2011-12-02   1510   0
ERP/CRM   方案   报告   HTML   C/C++  
P24

  大数据分析系统架构之探讨 文档

Server搭建大规模结构化存储集群 数据提取与分析: Hive Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在

guet_lee 2017-01-12   2237   0
P24

  大数据分析系统架构 文档

Server搭建大规模结构化存储集群 数据提取与分析: Hive Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在

wzf1118 2016-11-04   2940   0
P10

  重塑银行 IT 系统 文档

定,但这一类系统的出现,确实在很多银行引发了以数据仓库为核心的分析、管理型应用的大量诞生,且越来越起到更大的作用 这其实在IT领域不是新的东西,数据仓库目前的理论发展也比较完善了,国外也发展了很多年。

dengbo69 2012-07-03   416   0
P11

  Apache Hadoop入门第一步 文档

Chukwa:管理大型分布式系统的数据集合系统; HBase:可扩展的、分布式的数据库,以大表实现对结构化数据的存储; Hive:数据仓库基础设施,提供数据汇总(data summarization)和自主查询(ad hoc querying);

paradoxlee00 2012-04-11   5446   0
P3

  5种从excel数据导入oracle方法 文档

SQL*Loader是Oracle自带的数据加载工具,其数据导入比较专业,有各种参数及选项可供选择,经常是作为数据仓库中大型数据的导入方法选择。       优点:     1、可将导入命令写入BAT文件直接批量处理

tanoooooo 2012-12-28   3524   0
P2

  Cognos 8 BI 功能介绍 文档

智能的企业级ETL解决方案。它可以优化数据合并、抽取、转换和维度管理,提供适用于企业报表和分析的数据仓库

alex_hey 2012-11-13   2803   0

前雅虎 CTO 发布 Hadoop 云服务 Altiscale 资讯

无暇顾及那些刚刚开始使用Hadoop的用户。 如今又很多公司使 用Hadoop运行传统的企业数据仓库任务,或者与现有的IT环境进行深度集成,但是Altiscale的Hadoop云服务面向新的数据难题,例如在线

jopen 2013-06-13   9555   0
Hadoop  

Facebook欲做最大开源公司:不会靠卖软件赚钱 资讯

数据库)、Thrift(为扩展性跨语言服务提供框架)、Apache Hive(建立在 Hadoop 顶端的数据仓库基础结构)及其他很多项目,都属于 Facebook 自己的开源项目。而除此之外,Facebook

jopen 2014-12-21   5797   0
P2

  big资料 文档

Latin翻译成MapReduce程序序列。 7) Sqoop:是一个连接工具,用于在关系数据库、数据仓库和Hadoop之间转移数据。Sqoop利用数据库技术描述架构,进行数据的导入/导出;利用MapReduce实现并行化运行和容错技术。

fangunun 2016-12-22   643   0

eBay使用Hadoop和HBase成功构建下一代搜索 资讯

Hadoop 和 HBase 构建出一种显著改善的搜索体验。 译注 [1] Teradata 是数据仓库创新和分析性解决方案开发领域公认的全球领先者. 主页: http://www.teradata.com

码头工人 2011-11-23   15897   0
Hadoop   HBase  

MySQL在Web应用领域面临NoSQL的挑战 资讯

云计算的概念由来已久,但是直到开源软件将云计算的建设成本大幅降低后,云计算才得以蓬勃发展;类似的变化也发生在数据挖掘和数据仓库领域,直到 Hadoop 大幅降低大数据挖掘成本的同时提高了其性能,大数据才真正得以流行。

jopen 2012-05-30   14850   0
MySQL  

hadoop 里执行 MapReduce 任务的几种方式 经验

net/erikeldridge/a-brief-handson-introduction-to-hadoop-pig 3、构建数据仓库的类 SQL 开发语言:hive create table textlines(text string);

jopen 2012-10-15   39572   0
1 2 3 4 5 6 7 8 9 10