0推荐
9K 浏览

基于社交网络挖掘公司潜在用户

作为销售人员,在向客户介绍公司的新产品或技术的时候,是否考虑过参考已有的客户成功案例去说服新客户?是否想要去发现某客户可能采用的公司产品?是否希望去挖掘公司潜在的客户?回答是肯定的。挖掘潜在客户...
0推荐
17K 浏览

ELK 在 Spark 集群的应用

大数据处理技术越来越火,云计算平台也如火如荼,二者犹如 IT 列车的两个车轮,相辅相成,高速发展。如果我们将大数据处理平台比作一个可能会得病的人的话,那么日志分析系统就是给病人诊断的医生。由于集...
0推荐
9K 浏览

如何打造百亿级数据处理量的弹性调度容器平台

这些文件持续在线且数据种类多样,如果用户把这些文件在自己的基板上处理好后再上传到七牛,是非常不合算的事情。而七牛最先提供基于存储的数据处理功能方便用户去做数据处理,这些数据处理通常放在企业的客户...
0推荐
17K 浏览

面向大数据的时空数据挖掘

时空数据挖掘是数据挖掘中的重要研究内容,其中时空预测的应用领域最为广泛。随着信息技术的发展,人们已经不满足于单纯的空间数据的存储和展现,而是需要更先进的手段帮助理解空间数据的变化,发现空间数据之...
0推荐
14K 浏览

Presto架构及原理

Presto 是 Facebook 推出的一个基于Java开发的大数据分布式 SQL 查询引擎,可对从数 G 到数 P 的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别,据称该引擎的性...
0推荐
18K 浏览

RabbitMQ 高级指南:实现分布式通信

分布式系统是指: 通过网络把多个组件连接起来,并提供组件之间消息传递和协作的系统。 分布式系统要解决的问题很多,异构、伸缩性、开放、安全、容错等,但是基本问题是—— 提供组件之间消息通信 。没有...
0推荐
13K 浏览

漫画:什么是大数据?

大数据是具有海量、高增长率和多样化的信息资产,它需要全新的处理模式来增强决策力、洞察发现力和流程优化能力。
0推荐
9K 浏览

大数据基础框架设计——实时分析技术平台洞察与实践

今年是IoT物联网的元年,也是人工智能的元年。之所以人工智能这么热,与大数据有密不可分的关系,大数据就是现在网络时代的石油。
0推荐
28K 浏览

分布式系统,你真的了解吗?

当一个互联网业务获得大众欢迎的时候,最显著碰到的技术问题,就是服务器非常繁忙。当每天有1000万个用户访问你的网站时,无论你使用什么样的服务器硬件,都不可能只用一台机器就承载的了。因此,在互联网...
0推荐
13K 浏览

分布式缓存技术PK:选择Redis还是Memcached?

总的来看,Redis比Memcached的功能多很多,实现也更复杂。 不过Memcached更专注于保存key-value数据(这已经能满足大多数使用场景了),而Redis提供更丰富的数据结构及其他的一些功能。
0推荐
13K 浏览

Storm 的可靠性保证测试

Storm 是一个分布式的实时计算框架,可以很方便地对流式数据进行实时处理和分析,能运用在实时分析、在线数据挖掘、持续计算以及分布式 RPC 等场景下。Storm 的实时性可以使得数据从收集到处...
0推荐
7K 浏览

Spark生态系统中的图数据分析知识

图结构可有效表示稀疏矩阵,因而图数据分析可用于实现大数据分析。本文是Info对该书作者的访谈,内容包括图数据及分析技术、GraphX高效程序开发、图数据分析的趋势等。
0推荐
9K 浏览

当简单的计算遇上了大数,其实大数运算也很简单

大数的相加主要是通过字符串的相加来实现的。两个大数相加,找出位数较大的那个大数获取对应的长度, 然后对较小的那个数进行左补0直至长度和较大的那个数的位数一样,最后循环累加两个大数的每一位的数值...
0推荐
9K 浏览

你还需要知道的9个大数据技术

Hadoop是大数据领域最流行的技术,但并非唯一。还有很多其他技术可用于解决大数据问题。除了Apache Hadoop外,另外9个大数据技术也是必须要了解的。
0推荐
9K 浏览

经验分享 :大数据如何给运营做支撑

随着互联网、媒体、用户、市场的变化,企业发现过去他们所做的粗狂式运营已经不能有效的提升效率和增加企业用户了,所以,一些企业开始找寻新的运营方式,比如逐渐转变为CPM(每千人成本)化的精细化经营,...
0推荐
45K 浏览

生成全局唯一 ID 的 3 个思路

标识(ID / Identifier)是无处不在的,生成标识的主体是人,那么它就是一个命名过程,如果是计算机,那么它就是一个生成过程。如何保证分布式系统下,并行生成标识的唯一与标识的命名空间有着密不可分的关系。
0推荐
13K 浏览

Hive SQL 监控系统 - Hive Falcon

在开发工作当中,提交 Hadoop 任务,任务的运行详情,这是我们所关心的,当业务并不复杂的时候,我们可以使用 Hadoop 提供的命令工具去管理 YARN 中的任务。在编写 Hive SQL ...
0推荐
46K 浏览

每天近百亿条用户数据,携程大数据高并发应用架构涅槃

互联网二次革命的移动互联网时代,如何吸引用户、留住用户并深入挖掘用户价值,在激烈的竞争中脱颖而出,是各大电商的重要课题。通过各类大数据对用户进行研究,以数据驱动产品是解决这个课题的主要手段,携程...
0推荐
9K 浏览

PPTV之大数据集群容器化研究

PPTV作为国内视频领域的领先者,对于大规模流媒体的存储、处理、分发及应用,有着迫切的要求。容器技术及微服务模式的出现,使大规模的研发交付效率大为提高。因此我们基于Docker技术打造了DCOS。
0推荐
20K 浏览

分布式系统互斥性与幂等性问题的分析与解决

随着互联网信息技术的飞速发展,数据量不断增大,业务逻辑也日趋复杂,对系统的高并发访问、海量数据处理的场景也越来越多。如何用较低成本实现系统的高可用、易伸缩、可扩展等目标就显得越发重要。为了解决这...
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档