工作职位推荐系统的算法与架构 经验

中心的点击流数据以及其他应用事件 被复制到我们在奥斯丁数据中心的一个中心化的HDFS数据仓库中 。我们在这个数据仓库上进行计算分析并且构建我们的机器学习模型。 我们的职位搜索引擎是简单而直观的,只有两个输入:关键字和地点。

Vanessa0208 2016-12-20   86048   0

大数据的挑战和趋势 资讯

企业启动大数据最重要的挑战是数据的碎片化。在很多企业中尤其是大型的企业,数据常常散落在不同部门,而且这些数据存在不同的数据仓库中,不同 部门的数据技术也有可能不一样,这导致企业内部自己的数据都没法打通。如果不打通这些数据,

jopen 2014-12-01   34687   0

学习笔记:The Log(我所读过的最好的一篇分布式技术文章) 经验

在这种情况下,每个订阅者都以自己的步调消费数据。 一个批处理系统,比如Hadoop,或者一个数据仓库,是以小时或天为单位消费数据,而一个实时系统,通常在秒级消费数据。 而数据源或者log,对消

jopen 2015-07-20   53392   0

图数据库中的高科技和高安全性 资讯

在互联网世界中,各种类型的网络也愈显重要,而探究网络的能力正成为其现代化意义中的基本要素。然而和关系新数据库一样,图数据库只是工具箱中的 一种工具,它可以被正确地利用,或者是相反。所以对这个令人兴奋的新技术,至少从最高的设计层次上

jopen 2015-07-18   16354   0

每个软件工程师都应该知道的有关实时数据的统一概念 经验

n-Transformation-Loading的缩写,即数据提取、转换和加载)——相对于关系型数据仓库。但我描述的东西很大程度上可以理解为,将ETL推广至实时系统和处理流程。 你一定不会听到

jopen 2014-02-10   98975   0
P17

  ASP.NET数据绑定技术 文档

为了理解数据控件如何工作,需要理解数据源控件在页面中的生命周期,当使用数据源控件或者是需要扩展数据绑定模型时是非常重要的。数据绑定控件的产生顺序如下所示: (1)创建page对象。 (2)开始页面生命周期,Page.Init和Page

hygt100 2011-05-23   3910   0
.NET开发   C#   SQL   VB.NET   XML  

详解Hadoop核心架构 经验

通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。

jopen 2015-07-30   19557   0

Hive深入浅出 经验

capabilities of the language. Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在

jopen 2014-08-31   63675   0
P61

  SAP BW BI 培训教程经典案例 文档

SAP BW – BW核心功能数据仓库 (SAP BW 管理员工作台) 抽取、传输与上载 数据仓库管理 业务模型 BI 平台 在线分析处理 (OLAP) 数据挖掘 预警 元数据仓库 BI 套装工具 (SAP

redeyes001 2014-09-26   5912   0
SAP   ERP/CRM   培训   C#   Intel  
P113

  云计算apache HIVE的使用 文档

云计算apache HIVE的使用 一、 Hive 概述 Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在

xnbw 2016-01-11   2024   0
P35

  RationalRose2003基础教程02 文档

diagram描述系统中的物理结构静态结构建模 10. 2.1 模型图窗口 2 模型图水平滚动条模型图工具箱垂直滚动条标题栏控制菜单栏 11. 2.1 模型图窗口 可以在模型图窗口中创建和修改模型的图形视图

pypwxh 2010-10-24   3602   0
P40

  Visual Studio 2010 实用小技巧(文档) 文档

置方案。然后用工具—〉导入和导出设置导入它。 还有另一种代码段:将任意编辑器中的文本字节选定拖到工具箱,在需要的时候再拖下来。如图:   5、将"博客园精华区"加入Visual Studio起始页      

yao6575580 2012-10-25   2867   0
P44

  the log:每个程序员都应该知道有关实时数据的统一抽象 文档

ng的缩写,即数据提取、转换和加载) 通常只是覆盖了数据集成的一个有限子集 —— 主要在关系 型数据仓库的场景。但我描述的东西很大程度上可以理解为,将ETL推广至覆盖实时系统和处理流程。 你一定不会听

june.zk 2016-09-12   479   0
P31

  大数据模型构建平台介绍v1.0 文档

项目实施往往加班加点,人力资源复用率较低,工作效率不高 通信行业BI系统进入瓶颈期,指标杂乱,管理无序,效率低下,亟需对数据仓库进行重构; 目前多省已表达出重构需求,工程量随时可能放大 亚信战略转型,放眼金融业、电商、政企等

cqupt1987 2015-10-10   2002   0
方案   SQL  
P14

  ActionScript 3.0 编程技术实战宝典 文档

-11所示。 图1-11 【动作】面板 在图1-11中包含如下4个部分。 “ 动作工具箱 在【动作】面板中,动作工具箱的作用是提供ActionScript所有的包、类、属性和方法列表。(关于包、类、属

794785671 2014-06-25   3023   0
P18

  GIS 插件实验报告 文档

打开VS2008,新建一个项目,并命名为Test0710040121,出现如下窗口: 在出现的窗口的Form1.cs【设计】中,使用工具箱中的公共控件,将PictureBox添加到Form1.cs中,中出现下图: (2)在解决方案资源管

zpmaster 2013-04-21   2032   0

盗版开发者的春天?黑客已经泄露Xbox One SDK 资讯

使得微软的 Xbox 在线平台瘫痪,但对微软来说这并不是灾难的终结——微软 Xbox 在线平台的软件开发工具箱(SDK)可能在网络上被自由地传播。 Xbox SDK 泄露 自称为 H4LT 的组织声称已经获得微软官方

jopen 2015-01-04   4698   0
黑客  
P64

  大数据智能分析解决方案介绍-ibm 文档

在大数据的新世界中,我们必须更换所有陈旧系统 大数据就是 Hadoop 较为陈旧的事务数据已经不再重要 数据仓库已是昨日黄花 大数据适合熟知互联网的企业。传统业务与大数据毫无关系 我们不具备相应的需求、预算或

guet_lee 2017-01-15   10670   0

国产首创分布式内存数据库一体机发布 资讯

半结构化和非结构化的数据,为企业提供快捷的业务决策支持。它的出现突破了传统基于磁盘的数据仓库技术,解决了传统数据仓库难以分析结构化以外数据的难题,并通过高性能,线性扩展及整合方案为企业带来显著效益。它

jopen 2016-01-19   12763   0

BigInsights:解读IBM基于Hadoop的数据分析平台 资讯

能力。Streams 采用内存计算方式分析实时数据。InfoSphere 大数据分析平台还集成了数据仓库、数据库、数据集成、业务流程管理等组件。 BigInsight 整体框架图 BigInsights

openkk 2012-02-25   30861   0
Hadoop  
1 2 3 4 5 6 7 8 9 10