P31

开源大数据分析引擎impala实战 文档

大数据,作为目前工业界的主要技术趋势,定位于转化工业界的每一个细节市场,推动企业运用其数据开展业务的革命,并从根本上改变了支撑现代社会的IT基础架构。毫无疑问,大数据对中国意义重大,它给中国IT业的创新带来了巨大机会,没有其他任何一个国家比中国有更多的人口,更多的设备和更多的数据

landrebase 2018-07-31   3560   0
P27

小米统计的亿级大数据实时分析平台 文档

小米统计的亿级大数据实时分析平台

dt_zga 2018-07-17   798   0
P48

饿了么离线大数据平台实践 文档

饿了么离线大数据平台实践

WindStand 2018-01-18   436   0
P3

基于微博的大数据用户画像与精准营销 文档

在大数据时代,通过有关技术手段对新浪微博数据进行采集分析,构建用户画像模型,描述企业用户群体行为特征,为精准营销带来了可能。用户画像系统为企业提供全方位的掌握客户群体的信息标签,使企业了解、认知自己的客户。同时在品牌的传播与建设中,用户画像也是一个不错的思路。这为企业制定科学准确的营销方案打下了良好的基础

vincewi 2018-01-11   603   0
P2

手机用户画像在大数据平台的实现方案 文档

LED显示屏作为一项新型的技术应用在娱乐市场当中,以其高亮度、宽色域以及节能环保等优点逐渐成为室外展示市场的主角。但基于LED具有一定的离散性,导致显示屏在显示的过程中不能保证亮度和色度的一致性和均匀性,需要对显示屏进行色度及亮度的调整。文章将介绍LED显示屏的色度亮度调整技术的应用。

vincewi 2018-01-09   541   0
P39

滴滴大数据离线和实时平台架构和实践 文档

滴滴大数据离线和实时平台架构和实践

WindStand 2018-01-08   800   0
P19

云+时代大数据平台应用方案 文档

大数据特征数据规模大企业数据数据规模大部在TB级别以上,像银行电信等行业数据量都在PB以上,而且每年都是以40%以上的速度增长数据类型多除了以文本为主的结构化数据、以网页数据为代表的半结构数据,也存在大量网络日志、音频、视频、图片、地理位置信息等非结构化数据数据流转快要在秒级时间范围内给出分析结果,超出这个时间,数据就失去价值了价值密度低海量数据中,如何通过强大的机器算法,更迅速有效地完成数据的价值“提纯”4V效率成本价值SACC2017企业大数据应用现状数据ETL数据仓库数据分析数据挖掘物联设备应用系统外部数据数据面板存储管理计算处理分析技术运维成本资源成本技术成本核心技术决策者存储计算网络应用系统或者物联设备以及第三产生大量的数据通过ETL把各种类型的数据处理成高密度有价值的数据转换完成的数据进入数据仓库为下一步挖掘做准备数据分析任务可以在数据仓库中提取想要的数据深度挖掘通过机器学习和AI深度挖掘数据价值根据数据分析结果和挖掘结果决策者做出决策个角色通过数据面板获取想要的数据成本技术成本硬件成本运维成本效率SACC2017

WindStand 2018-01-08   552   0
P30

实时大数据在风控中的实践 文档

实时大数据在风控中的实践——数美基础架构负责人关涛SACC2017大纲背景介绍面临挑战业务分析架构设计经验心得SACC2017

WindStand 2018-01-08   410   0
P50

知乎⼤大数据平台架构和实践优化 文档

知乎⼤大数据平台架构和实践优化

WindStand 2018-01-08   471   0
P37

  大数据架构 文档

大数据架构

WillZhao 2018-01-02   314   0
P214

hadoop2.8_v2.5.1 文档

本书是关于目前最新Hadoop快速上手的教程。Hadoop自出现以来,就被广泛关注。特别是近几年数据增长量急剧膨胀,加上历史数据。如何处理这些海量数据成为炙手可热的问题。Hadoop的出现,无疑是良药奇方。Hadoop最早从0.x版本到1.x版本,再到2.x版本,发生了很大的变化。伴随hadoop的成长,hadoop已经不再是一个简单的数据分布式存储平台和工具,已经成长为一个完整的hadoop生态圈。相信读者会在后面不断的学习过程中,体会到这一点。

wangjianme 2017-12-19   321   1
P65

大数据白皮书(2016年)-中国信息通信研究院 文档

大数据是国家基础性战略资源,是21世纪的‚钻石矿‛。党中央、国务院高度重视大数据在经济社会发展中的作用,提出‚实施国家大数据战略‛,出台《促进大数据发展行动纲要》,全面推进大数据发展,加快建设‚数据强国‛。‚十三五‛时期是我国全面建成小康社会的决胜阶段,是新旧产业和发展动能转换接续的关键时期,全球新一代信息技术产业正处于加速变革期,国内市场应用需求处于爆发期,我国大数据产业发展面临重要的发展机遇。本白皮书是继《大数据白皮书(2014)》之后我院第二次发布大数据白皮书。本白皮书首先回顾和阐述了大数据的内涵及产业界定,并以大数据产业几个关键要素为核心,重点从大数据技术发展、数据资源开放共享、大数据在重点行业的应用、大数据相关政策法规等四个方面分析了最新进展,力求反映我国大数据产业发展状况的概貌。最后结合我国大数据发展最新状况及问题,提出了进一步促进大数据发展的相关策略建议。

wuaini234 2017-10-16   444   0
P43

零基础学大数据算法-简版电子书 文档

这是一个互联网的时代,也是一个大数据的时代。经常有朋友问起 :什么是大数据?大数据是做什么用的?我们为什么要研究大数据?应该怎么研究大数据?在寻找这些问题的答案时,许多朋友找到的内容常常是专业的概念、复杂的公式和难懂的“算法”,这让他们望而却步。很多计算机专业的新生或低年级学生在听到大数据的概念后对其非常好奇,却因没有足够扎实的专业基础知识而无法认识和理解大数据问题,更无法对大数据问题给出很好的解决办法。于是,笔者决定编写一本新生乃至非专业人士也能读懂的大数据算法教程。

樂鲁伊 2017-08-28   489   0
P23

韩涵-政务大数据-技术发展与标准化 文档

以推行电子政务、建设新型智慧城市等为抓手,以数据集中和共享为 途径,建设全国一体化的国家大数据中心,推进技术融合、业务融合、 数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管 理和服务。

georgeyzhg 2017-08-27   243   0
P10

  ZooKeeper简介 文档

ZooKeeper 是一个为分布式应用所设计的分布的、开源的协调服务。分布式的应用可以建立在同步、配置管理、选举、分布式锁、分组和命名等服务的更高级别的实现的基础之上。 ZooKeeper 意欲设计一个易于编程的环境,它的文件系统使用我们所熟悉的目录树结构。 ZooKeeper 使用 Java 所编写,但是支持 Java 和 C 两种编程语言。

公子小帆 2017-08-16   720   0
P48

  大数据(离线/实时)计算架构 文档

Flume是Cloudera提供的一个分布式、可靠、和高可用的海量日志采集、聚合和传输的日志收集系统,支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。

sum154346 2017-07-25   441   0
P3

  openstack与cloudstack比较 文档

OpenStack是一个美国国家航空航天局和Rackspace合作研发的,以Apache许可证授权,并且是一个自由软件和开放源代码项目。CloudStack是新加入到Apache基金会中的开源云计算平台。CloudStack开发语言为Java,此前为Cloud.com研发应用的商业软件,此后被Citrix思杰收购,2012年4月5日思杰宣布将CloudStack项目提交至Apache基金会,CloudStack成为Apache许可下的完全开源软件。

cmss201706 2017-06-30   302   0
P158

  apache-spark源码走读 文档

在对Spark的源码进行具体的走读之前,如果想要快速对Spark的有一个整体性的认识,阅读Matei Zaharia做的Spark论文是一个非常不错的选择。

bxingqing 2017-06-12   295   0
1 2 3 4 5 6 7 8 9 10