P49

  文档式数据库在Hadoop集群中的应用 文档

海量数据检索,索引和搜索。 结构化与半结构化高性能大规模并行处理; 海量数据实时检索分析应用 企业级数据仓库 低成本海量数据存储和分析 实时大数据查询分析互为补充而非取代 26. SequoiaDB 与H

tony2007 2015-06-19   1856   0

MapReduce 模式、算法和用例(MapReduce Patterns, Algorithms, and Use Cases) 经验

第二大部分是关于MapReduce模式,Katsov讨论了包括多关系形MapReduce模式,通常用于数据仓库应用程序。这些模式在Hive和Pig实现中广泛使用,并包括基于推断/函数的数据选择,数据预测、数

openkk 2012-02-24   103805   0

大数据架构和模式(五) - 对大数据问题应用解决方案模式并选择实现它的产品 经验

以实现更好的预测。 分析技术使组织能够从非结构化数据中提取重要信息。虽然大量结构化信息存储在数据仓库中,大多数关于欺诈的关键信息都是非结构化数据,比如第三方报告,它们很少被分析。在大多数保险机构中,社交媒体数据没有被正确地存储或分析。

jopen 2015-02-01   26109   0

数据库设计中的14个常用技巧 经验

才能直接在基本表上操作。请读者想想:这是为什么? 11. 中间表、报表和临时表 中间表是存放统计数据的表,它是为数据仓库、输出报表或查询结果而设计的,有时它没有主键与外键(数据仓 库除外)。临时表是程序员个人设计

jopen 2014-09-15   69418   0

大型网站架构模式 经验

了要处理这些在线业务,还有很大一部分用户没有直观感受的后台业务要处理,包括搜索 引擎的索引构建,数据仓库的数据分析统计等。这些业务的计算规模非常庞大,目前网站普遍使用Hadoop及其MapReduce

dgy7 2015-05-21   36756   0
架构  

每天近百亿条用户数据,携程大数据高并发应用架构涅槃 经验

如果不熟悉的同学只要知道Hadoop 主要用于大数据量存储和并行计算批处理工作。 Hive 是基于Hadoop平台的数据仓库,沿用了关系型数据库的很多概念。比如说数据库和表,还有一套近似于SQL的查询接口的支持,在Hive里

李厦戎:一个在生物领域创业的数据控(图灵访谈) 资讯

跟你之前的工作有关系吗? 我之前的工作基本上就是为上述的数据应用设计 pipeline,做数据整合和预处理,构建数据仓库,选择算法,并在分布系统上实现处理流程。今年年初的时候跟同学聊天,他就是做生物领域的,他跟我提

jopen 2014-12-02   20911   0
创业  

SQL/NoSQL两大阵营激辩:谁更适合大数据 资讯

Presto,意在对其 PB 级别 HDFS 集群数据进行查询。根据 Facebook 方面的说法:“由于我们的数据仓库规模已经增长至 PB 级别、业务需求也逐步发展,我们显然需要一套经过优化的交互式系统以实现更低的查询延迟。”除此之外,Cloudera

jopen 2014-07-29   31640   0
NOSQL  

大数据时代的裸奔 资讯

库克耶所著的《大数据时代》一书的定价 49.9 元,我以此书为基础,又参考了其它书籍文献,结合我以前学习过的数据仓库和数据挖掘知识,把内容进行了提炼和总结。我的想法是:通过阅读这篇文章,只花费您原书 1/10 的金钱,浪费您读原书的

jopen 2015-01-14   13354   0

Apache Eagle:分布式实时 Hadoop 数据安全方案 资讯

分析平台基础架构部(Analytics Infrastructure)是eBay的全球数据及分析基础架构部门,负责eBay在数据库、数据仓库、Hadop、商务智能以及机器学习等各个数据平台开发、管理等、支持eBay全球各部门运用高端的数

bger 2015-10-28   30641   0

10 个最适合 Web 和 APP 开发的 NodeJS 框架 资讯

同时适用于客户端和服务器端。 它使用的 DDP 协议可以让你在后端连接简单的数据库服务、企业数据仓库、甚至 IOT 传感器。Meteor 带有自己默认的栈,但又有足够的灵活性,可以让你选择自己的技

jopen 2015-12-11   31297   0
NodeJS  
P5

  Oracle创建索引要做到三个适当 文档

。为此,到底在表中创建多少索引合适,就需要在这个更新速度与查询速度之间取得一个均衡点。如对于一些数据仓库或者决策型数据库系统,其主要用来进行查询。相关的记录往往是在数据库初始化的时候倒入。此时,设置的

springlin2012 2013-05-09   3135   0
P14

  AIX V5.3 中 IPv4 和 IPv6 的网络接口操作 文档

Software Labs 的软件工程师。在过去两年里,他一直为 IBM 工作,主要研究 SARPC。他在数据仓库工具 (Ab-Initio) 方面也具有丰富的使用经验。Manish 拥有印度 Indian Institute

kk_nike 2012-08-19   3092   0
IBM AIX  
P9

  数据交换平台建设方案 文档

等;这样,当数据通过Message Broker时,我们便可以将数据进行各种数据库操作,为今后的数据仓库做准备。 东软集团股份有限公司 数据交换平台建设方案 第页 通过Message Broker,用

guolimin 2016-08-04   1960   0
方案  

中国首份AI落地白皮书发布!地方政府规模大,金融领域最积极 资讯

能帮助技术业务人员快速寻找到构建 AI 应用、分析过程中将要使用的数据,将成为数据访问和授权控制的一个点,保证在分布式数据仓库中实现有效地数据保护和一致性应用,也会提升企业内部人员数据素养,实现数字化运营、转型的企业战略。

五嘎子 2019-12-10   1932   0
AI  

360齐向东:工业互联网安全隐患巨大 安全现状令人担忧 资讯

4.  建立工业互联网安全运营与分析中心。对企业内工业数据和安全数据持续收集,建立企业的安全数据仓库。利用大数据方法发现工业生产异常,这是数据驱动安全的最佳实践方法; 5.  重点防御保证关键

jopen 2017-02-22   13202   0
360  
P4

  大型互联网网站架构心得之一 文档

据库上,一般来说够用,如果还不行可以用硬件来实现数据库的负载均衡。当然,对于BI,我们可能还会有数据仓库。 架构上考虑到了这些之后,流量大了,就可以在这个的基础上再去调整或者做WEB服务器或者应用服务

lgh8002 2013-06-11   4217   0
P17

  Maven入门教程 文档

因为HelloFriend依赖Hello模块,但是此模块在个人仓库和中央仓库中并不存在 l 需要重新构建Hello第一个项目并安装到数据仓库, 在Hello根目录下执行mvn clean install, 就会部署的中央仓库中 1.5.

Shawn12345 2016-08-04   1052   0
P5

  数据库设计原则 文档

  才能直接在基本表上操作。请读者想想:这是为什么?  11. 中间表、报表和临时表    中间表是存放统计数据的表,它是为数据仓库、输出报表或查询结果而设计的,有时它没有主键与外键(数据仓    库除外)。临时表是程序员个人设

rocky_w 2016-12-04   1325   0
SQL   C/C++  
P25

  MongoDB 技术交流 文档

用程序。 传统的商业智能应用:针对特定问题的BI数据库会对产生高度优化的查询方式。对于此类应用,数据仓库可能是更合适的选择。 需要SQL的问题 8. MongoDB操作 安装 wget http://downloads

zhangg 2013-06-19   6249   0
1 2 3 4 5 6 7 8 9 10