ModeShape是一个分布式,层次化,事务性的,一致的数据存储。支持查询、全文搜索、事件,版本控制,引用和灵活的动态架构。它非常快的,高度可用,高度可扩展,100%开源和采用Java编写。 客户端使用
Chukwa 是一个开源的用于监控大型分布式系统的数据收集系统。它构建在 hadoop 的 hdfs 和 map/reduce 框架之上的,继承了 hadoop 的可伸缩性和鲁棒性。Chukwa 还包
1. 数据存储的分类与对比类型成熟度特点 缺点适用场景通用性使用成本传统关系数据库很成熟从几千到几千万的记录规模都能存储,支持事务,周边开发语言、框架和平台都有完毕的支持,是企业应用必不可少的基础设施
2013-12-5文章内容来自:Java私塾 Hadoop实战-初级部分 之 Hadoop IO 整体课程概览 第一部分:开始云计算之旅 第二部分:初识Hadoop 第三部分:Hadoop 环境安装部署 第四部分:Hadoop Shell
可视化工具的简短列表 在本文中,将对很多流行的 Linux 数据可视化工具进行一下调查,并对其中一些工具进行更深入的探讨。例如,某个工具是否为进行数值计算而提供了一种语言?这个工具是交互式的还是提供
十大免费数据可视化工具
大数据时代 数据挖掘十大经典算法 不仅仅是选中的十大算法,其实参加评选的18种算法,实际上随便拿出一种来都可以称得上是经典算法,它们在数据挖掘领域都产生了极为深远的影响。 1.C4.5 C4.
Converged Data Platform 将 Hadoop 和 Spark 的强大功能与全局事件流、实时数据库能力与企业存储集成到了一起,用于开发与运行创新性的数据应用。MapR Platform 由业界最
qxde01 数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识。 当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集成数据挖掘算法平
Database。基于 B+ Tree 的面向列的数据库。是云数据库(CloudDatabase)的数据引擎内部选型之一。 Tokyo Cabinet 是一个DBM的实现。这里的数据库由一系列key-value对
数据库已经成为黑客的主要攻击目标,因为它们存储着大量有价值和敏感的信息。 这些信息包括金融、知识产权以及企业数据等各方面的内容。网络罪犯开始从入侵在线业务服务器和破坏数据库中大量获利,因此,确保数据库
Platform 将Hadoop和Spark的强大功能与全局事件流、实时数据库能力与企业存储集成到了一起,用于开发与运行创新性的数据应用。MapR Platform由业界最快速、最可靠、安全且开放的数据基础设施所
每次在为一家企业搭建大数据平台的起步阶段,他们总是向我展示各种他们采用的各种前沿技术,还有他们视若珍宝的数据储备。但是毫不避讳地讲,我根本不想在这个阶段讨论这些方面的细节。因为炫酷的技术或海量的数据储备并不是大数据项目成功最关键因素。
导读: 无论是关系型数据库还是非关系型数据库,都是某种数据模型的实现。本文将为大家简要介绍5种常见的数据模型,让我们来追本溯源,窥探现在流行的数据库解决方案背后的神秘世界。 什么是数据模型? 访
为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。 在实际开发中最为常见的设计范式有三个:
项集的集合 L2,而L2 用于找L2,如此下去,直到不能找到 k- 项集。每找一个 Lk 需要一次数据库扫描。为提高频繁项集逐层产生的效率,一种称作Apriori 性质的重 要性质 用于压缩搜索空间。
Cabinet的NoSQL Database。基于 B+ Tree 的面向列的数据库。是云数据库(CloudDatabase)的数据引擎内部选型之一。 项目主页: http://www.open-open
大屏数据可视化设计方法论很少,正好自己参与过部门多个大屏项目,所以总结了大屏可视化设计的方法。希望通过这篇文章能帮助大家整理思考过程,提高工作效率,同时很好的达到目标,找到兴趣。 下图为参与过的项目大屏主要部分。
导读: pingdom 网站收集各种资料汇总了一篇 2011 年的数据,涉及到 Email、网站、浏览器、服务器、移动、社交网络和互联网用户等方面。内容也颇为丰富,并且有少量配图。以下是文章内容:
大数据时代,数据过剩,人才短缺,越来越多的IT专业人士希望能够进入充满机遇的大数据领域,但是,到底哪些具体的大数据专业岗位和人才最为吃香呢?人力资源公司Kforce近日发布了一份报告根据 IT职业薪酬水平