海量数据实时OLAP分析系统-Druid.io安装配置和体验 经验

关键字:druid、druid.io、实时olap、大数据实时分析 导读: 一、Druid简介 二、Druid架构组成及相关依赖 三、Druid集群配置 四、Druid集群启动

jopen 2015-11-18   136332   0
Druid  

利用 ELK系统分析Nginx日志并对数据进行可视化展示 经验

一、写在前面 本文介绍的是单独监控nginx 日志分析再进行可视化图形展示,并在用户前端使用nginx 来 代理 kibana的请求响应,访问权限方面暂时使用 HTTP 基本认证 加密用户登录。

dkrt7160 2016-09-12   116493   0

云教育之微软数据平台构建业务决策分析系统 博客

遇到了业务增长带来的数据挑战。 随着体育彩票玩法的不断增多和变化,体育彩票业务系统也随之增多。这些业务系统由于建设的时间不同,彼此相对独立,每一种彩票都作为一项单独的数据源。当需要对一段时期的

vivian0203 2012-03-06   1560   0
P19

  javaweb之十四(元数据分析) 文档

深入dbutils的实例原理-元数据分析 讲师:王健,QQ:549051701 1、今天的主要内容: 2、今天的主要内容如下 2.1、表之间的关联中的级联关系 1:不设置 - 默认。 当删除主表中的数据时,如果子表中已

wangjianme 2013-03-03   1425   0
P

数据结构与算法分析学习笔记 文档

数据结构与算法分析是计算机专业的必修课——但遗憾的是,我在大学阶段并不是计算机专业的学生,以至于没有系统地跟着老师学习过这门课程。现在我已经工作了,在实际的工作中,我经常感到自己的基础知识不够,有很多问题无法解决。在经历了一段痛苦的斗争后,我选择了自学的道路,想把这门课程扎扎实实地学好。教科书中已经给出了大部分的代码,因此,我基本上也只是重复敲入了一次而已(或者是改写成C++),但这并不是没有意义的。我们在看书的时候经常会觉得自己已经懂了,但如果真的要亲自动手去做了,却会感到无法下手。我认为,亲自输入一次代码并调试通过,比任何空谈都有效。

hb0308513 2011-01-09   461   0

DataCleaner 3.5.1 发布,数据质量分析 资讯

是一个数据质量分析工具,可让您进行数据分析,验证和模拟类似ETL的任务。这些活动可以帮助您管理和监控数据质量,以确保您的数据是有用的,适用于您的业务情况。它可用于主数据管理(MDM)的方法,数据仓库项目,统计研究,为提取

jopen 2013-06-13   6337   0

数据分析到底需要多少种工具? 资讯

种不同的分类学习方法(分类学习算法)在 121 个数据集上的性能,发现 Random Forest (随机森林)和 SVM (支持向量机)分类准确率最高,在大多数情况下超过其他方法。本文针对“大数据分析到底需要多少种工具?”这

码头工人 2015-01-02   17990   0
P43

  数据结构经典问题和算法分析 文档

数据结构经典问题和算法分析(一)-迭代法 来源:   作者:   2007-5-30 21:17:53   字体:[大 中 小] 一、迭代法    迭代法是用于求方程或方程组近似根的一种常用的算法设

threeg 2014-11-20   433   0

运用Spark加速实时数据分析 资讯

Hadoop是一个成熟的开发框架,其连接着庞大的生态系统,并且得到了Cloudera、Hortonwork、Yahoo这些卓越机构的支持与贡献,并且为各个组织提供了许多工具来管理不同大小规则的数据。 在过去,Hadoop

jopen 2015-10-29   11656   0
Spark  

如何运用Spark进行实时数据分析 资讯

Hadoop是一个成熟的开发框架,其连接着庞大的生态系统,并且得到了Cloudera、Hortonwork、Yahoo这些卓越机构的支持与贡献,并且为各个组织提供了许多工具来管理不同大小规则的数据。 在过去,Hadoop

勿忘初心321 2015-12-21   32298   2

实时大数据分析平台:Ebay Pulsar 经验

eBay 开源的实时大数据分析平台。 作为全球性的商务平台和支付行业领先者,拥有海量的用户行为数据。 基于现有的hadoop大数据处理,已经不能够满足业务上对实时性的需求。基于过去的大数据处理的经验和对最

jopen 2015-03-03   35429   0

数据中心丢包分析及解决方案 经验

上周对数据中心tcp数据传输的超时重传时间进行了探究,是的,我们可以缩短重传超时时间,但为什么在数据中心内部也会出现丢包呢?下面会对这个问题进行探讨。 下面几种丢包情形是大家所熟悉的: 1、数据中心内网的某个端口的带宽跑满

jopen 2015-03-31   22090   0
数据  

使用Python和Pandas分析Pronto CycleShare数据 经验

这是一篇非常不错的pandas 分析入门文章,在此简单翻译摘录如下。 本周,西雅图的自行车共享系统 Pronto CycleShare 一周岁了。 为了庆祝这一点,Pronto 提供了从第一年的数据缓存,并宣布了 Pronto

demond123 2017-02-20   19371   0
P20

  数据流图与需求分析建模案例 文档

2.2 数据流图数据流图(Data Flow Diagram,DFD)是描述系统数据流程的图形工具,它标识了一个系统的逻辑输入和逻辑输出,以及把逻辑输入转换为逻辑输出所需的加工处理。数据存储数据源点 或终点加

jidechao 2012-06-13   6319   0
报告  

PHP查询MySQL大量数据的内存占用分析 问答

这篇文章主要是从原理, 手册和源码分析在PHP中查询MySQL返回大量结果时, 内存占用的问题, 同时对使用MySQL C API也有涉及. 昨天, 有同事在PHP讨论群里提到, 他做的一个项

jopen 2011-12-20   14962   2
MySQL   PHP   C/C++  

Java 网络数据分析包 JNetStream 经验

JNetStream 是一个用 Java 语言开发的网络数据分析类库,同时也提供了一个分析工具。可以通过内置的NPL语言定义自己需要的协议 (比如可用NPL定义RTP与SIP协议),NPL的语法与J

fmms 2012-01-17   41414   0

思科安全大数据分析框架:OpenSOC 经验

思科在 BroCON 大会上亮相了其安全大数据分析架构 OpenSOC,引起了广泛关注。OpenSOC 是一个针对网络包和流的大数据分析框架,它是大数据分析与安全分析技术的结合, 能够实时的检测网络异常情

jopen 2014-12-19   45317   0

6个用于大数据分析的最好工具 经验

com/archives/22617 大数据是一个含义广泛的术语,是指数据集,如此庞大而复杂的,他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些 数据集收集自各种各样的来源:传感器

jopen 2015-02-09   54075   0

使用Apache Spark分析豆瓣电影数据 经验

不然自己抓取豆瓣的电影数据分析下。 本来是想实践下豆瓣电影的推荐系统,想通过实际的数据来完成”Collaborative filtering”, 目前的第一步就是先获取数据,这也是这篇博文的主要内容。

jopen 2015-07-12   26561   0

GWpy - 引力波数据分析工具 经验

GWPY是一个面向对象编程的Python包,也就是说,数据对象是这个包的核心关注点。每一个数据对象都体现为一个类实例,包含了其属性和包含的数据。 GWPY提供了4种核心数据对象,分别代表引力波探测器所产生的四种标准数据: TimeSeries(时间序列数据)

w2c2y2 2016-02-14   6406   0
1 2 3 4 5 6 7 8 9 10