开源项目,开源代码,开源文档,开源新闻,开源社区

简介 Druid 是一个开源的，分布式的，列存储的，适用于实时数据分析的存储系统，能够快速聚合、灵活过滤、毫秒级查询、和低延迟数据导入。 Druid在设计时充分考虑到了高可用性，各种节点

jopen 2015-11-16 19643 0

Druid 分布式/云计算/大数据

Spark大数据分析框架的核心部件 Spark大数据分析框架的核心部件包含RDD内存数据结构、Streaming流计算框架、GraphX图计算与网状数据挖掘、MLlib机器学习支持框架、Spark

jopen 2016-01-05 18274 0

分布式/云计算/大数据

com/archives/41312 摘要：介绍了数据挖掘的定义，分析了日志数据面临的挑战及对其进行挖掘的原因。讨论了日志数据挖掘的需求，归纳了对日志数据挖掘的具体内容，总结了日志数据挖掘的具体应用。该研究对加强企事业

MartinCudmo 2016-02-21 39034 0

数据挖掘

本篇文章是使用python抓取数据的第一篇，使用request+BeautifulSoup的方法对页面进行抓取和数据提取。通过使用requests库对链家网二手房列表页进行抓取，通过Beautiful

azkb6080 2016-12-03 26851 0

Python开发 beautifulsoup

P64

2. 目录大数据与分析概述高性能运算Symphony解决方案 DB2 BLU助力高性能数据集市大数据案例分析 3. 大数据与分析概述 4. “上个月在瑞士达沃斯举行的世界经济论坛上,大数据是一个热点

guet_lee 2017-01-15 10670 0

分布式/云计算/大数据方案报告 Intel C/C++

P29

1. Oracle数据库性能优化第六讲：DB CACHE分析与优化主讲人：白鳝 2. Oracle的DB CACHE存储最近使用过的数据块通过LRU 算法管理（8i开始引入了tch） DB_BLOCK_SIZE

adt126 2014-01-16 629 0

Oracle 数据库服务器报告培训 ini

进，大量数据日积月累。我们迫切需要一种工具来满足从数据中发现知识的需求！而数据挖掘便应运而生了。正如书中所说：数据挖掘已经并且将继续在我们从数据时代大步跨入信息时代的历程中做出贡献。 1、数据挖掘数

xsh1019 2013-01-05 10919 0

数据挖掘

2016年大数据和分析市场的21个趋势预测（来源：易达大数据）导读：随着社交媒体、移动化和云计算的发展，数据分析及相关的技术已经作为一款具有颠覆性的技术在这个数字时代占有了一席之地了。在过去的20

leo1986leo 2016-08-06 622 0

大数据分布式/云计算/大数据

数据挖掘中聚类分析的技术方法汤效琴戴汝源摘要：数据挖掘是信息产业界近年来非常热门的研究方向，聚类分析是数据挖掘中的核心技术。本文对数据挖掘领域的聚类分析方法及代表算法进行分析，并从多个方面对

likfefe 2016-01-14 2335 0

数据挖掘

Slicer是一个开源的数据可视化和图像分析软件包。3D Slicer本身设计支持多种平台，包括Windows, Linux 和 Mac Os X。3D Slicer是一种很方便的观察医学图像数据三维场景的工具软件。它具有以下特性：

jopen 2012-03-12 107389 0

3D 3D图形处理库

LabKey Server 是一套开源软件，帮助科学家组织，分析和分享生物医学研究的数据。LabKey Server是一个安全的，基于Web的数据管理平台，该软件是模块化，可配置和可定制的为每个实验室的需要。

jopen 2013-11-19 17649 0

LabKey Server

流处理”之中，实时处理消息并更新数据库。这是管理队列及工作者集群的另一种方式。 Storm也可被用于“连续计算”（continuous computation），对数据流做连续查询，在计算时就将结果以流的形式输出

jopen 2012-11-12 22492 0

Twitter 分布式/云计算/大数据

FnordMetric 是个基于redis/ruby 的实时事件跟踪应用，是个收集和可视化时间序列数据的框架，用户可以在几分钟内创建漂亮的实时分析仪表盘。 FnordMetric Enterprise FnordMetric

jopen 2014-02-09 27481 0

FnordMetric

一、问题：数据库表数据量极大（千万条），要求让服务器更加快速地响应用户的需求。二、解决方案： 1.通过高速服务器Cache缓存数据库数据 2.内存数据库（这里仅从数据缓存方面考虑，当然，

jopen 2014-09-02 396591 0

Memcache Redis MongoDB NoSQL数据库

P24

Tachyon： 15 Mesos: 16 Yarn: 16 BlinkDB ： 17 三、结构化数据生态圈： 18 DBSync： 18 OLAP 19 HANA 19 Spark与Hadoop的对比

guet_lee 2017-01-12 2237 0

分布式/云计算/大数据

Impala 孵化成功，升级为顶级项目。 Impala 是一个高性能分析数据库，可针对存储在 Apache Hadoop 集群中的 PB 级数据进行闪电般快速的分布式 SQL 查询。Impala 还是一个现代化，大规模分布式，大规模并行的

jopen 2017-11-29 28846 0

数据库 Impala 高性能

如何定义图数据? Michael Malak：就事论事，图结构看上去并非像股价图那样，而是边和点的集合。但这只是一种模糊的数学抽象。更具体地说，在书的第一章中我们将真实世界中的图划分为五类：网络、

pcus3589 2016-10-19 7473 0

Spark 数据分析分布式/云计算/大数据 GraphX

你知道吗？评价一个人是不是 NB，有一个独特但是客观的方法，就是利用一个人的微博数据来计算。一个人的微博资料，关注人的级别，他的访问设备，被关注人的身份，综合起来，就是一个人的身份参数。这些参数

aeon 2016-10-24 8381 0

数据分析移动设计

BigQuery 云数据分析引擎。 BigQuery 是 Google 推出的一项 Web 服务，该服务让开发者可以使用 Google 的架构来运行 SQL 语句对超级大的数据库进行操作。BigQuery

jopen 2011-11-15 9919 0

Google

正为世界最大的射电望远镜开发新的数据管理和分析技术，平方公里阵(Square Kilometre Array)将于 2024 年运行，IBM 认为即使未来最先进的计算机也难以处理望远镜产生的海量数据。 SKA

fmms 2012-04-02 6252 0

IBM

Java数据分析工具包的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

Redis MongoDB Oracle 数据库 IBM C/C++ 数据挖掘 Druid Intel 大数据 Spark 数据分析 Impala 移动设计高性能 Python开发数据库服务器分布式/云计算/大数据 NoSQL数据库 3D图形处理库 Memcache GraphX ini FnordMetric LabKey Server Google beautifulsoup Twitter

Druid 实时数据分析存储系统经验

Spark大数据分析框架的核心部件经验

基于日志文件的数据挖掘机理分析与研究经验

使用python抓取并分析数据—链家网(requests+BeautifulSoup) 经验

大数据智能分析解决方案介绍-ibm 文档

oracle数据库性能优化实务第6讲db cache分析与优化文档

数据挖掘与分析心得体会文档

2016年大数据和分析市场的21个趋势预测文档

数据挖掘中聚类分析的技术方法文档

3D Slicer - 开源的数据可视化和图像分析软件包经验

组织，分析和分享生物医学研究数据的开源软件：LabKey Server 经验

Twitter 数据实时分析处理攻击 Storm 经验

实时数据分析仪表盘框架：FnordMetric 经验

Memcache,Redis,MongoDB（数据缓存系统）方案对比与分析经验

大数据分析系统架构之探讨文档

高性能分析数据库 Impala 升级为 Apache 顶级项目资讯

Spark生态系统中的图数据分析知识经验

打开数据分析的门，就再也不愿回去了经验

Google正式开放BigQuery，提供云数据分析服务资讯

IBM为望远镜开发数据分析系统资讯

Java数据分析工具包的相关搜索

关键词

Druid 实时数据分析存储系统 经验

Spark大数据分析框架的核心部件 经验

基于日志文件的数据挖掘机理分析与研究 经验

使用python抓取并分析数据—链家网(requests+BeautifulSoup) 经验

大数据智能分析解决方案介绍-ibm 文档

oracle数据库性能优化实务第6讲db cache分析与优化 文档

数据挖掘与分析心得体会 文档

2016年大数据和分析市场的21个趋势预测 文档

数据挖掘中聚类分析的技术方法 文档

3D Slicer - 开源的数据可视化和图像分析软件包 经验

组织，分析和分享生物医学研究数据的开源软件：LabKey Server 经验

Twitter 数据实时分析处理攻击 Storm 经验

实时数据分析仪表盘框架：FnordMetric 经验

Memcache,Redis,MongoDB（数据缓存系统）方案对比与分析 经验

大数据分析系统架构之探讨 文档

高性能分析数据库 Impala 升级为 Apache 顶级项目 资讯

Spark生态系统中的图数据分析知识 经验

打开数据分析的门，就再也不愿回去了 经验

Google正式开放BigQuery，提供云数据分析服务 资讯

IBM为望远镜开发数据分析系统 资讯

Java数据分析工具包 的相关搜索

关键词

Druid 实时数据分析存储系统经验

Spark大数据分析框架的核心部件经验

基于日志文件的数据挖掘机理分析与研究经验

oracle数据库性能优化实务第6讲db cache分析与优化文档

数据挖掘与分析心得体会文档

2016年大数据和分析市场的21个趋势预测文档

数据挖掘中聚类分析的技术方法文档

3D Slicer - 开源的数据可视化和图像分析软件包经验

Memcache,Redis,MongoDB（数据缓存系统）方案对比与分析经验

大数据分析系统架构之探讨文档

高性能分析数据库 Impala 升级为 Apache 顶级项目资讯

Spark生态系统中的图数据分析知识经验

打开数据分析的门，就再也不愿回去了经验

Google正式开放BigQuery，提供云数据分析服务资讯

IBM为望远镜开发数据分析系统资讯

Java数据分析工具包的相关搜索