分析CSDN泄漏数据信息的一些数据 资讯

CSDN 这次数据泄漏,同时也给了我们一些有趣的分析数据。 我们可以轻松地统计挨踢人士的邮箱使用情况,以及通常的密码长度等信息: 大家通常最关心密码 来看看大家最经常使用的密码是什么吧

jopen 2011-12-21   5682   1
CSDN  

颠覆大数据分析之Spark弹性数据 经验

译者:黄经业 Spark中迭代式机器学习算法的数据流可以通过图2.3来进行理解。将它和图2.1中Hadoop MR的迭代式机器学习的数据流比较一下。你会发现在Hadoop MR 中每次迭代都会

likeo 2015-04-21   18486   0

Python的数据科学(数据分析&机器学习)工具和扩展库:mlxtend 经验

Python的数据科学(数据分析&机器学习)工具和扩展库,包括文本预处理、Pandas工具、文件IO工具、Scikit-learn工具、数学工具、Matplotlib工具等 项目主页: http://www

jopen 2015-02-25   41129   0

使用Python抓取欧洲足球联赛数据进行大数据分析 经验

Scraping 在大数据时代,一切都要用数据来说话,大数据处理的过程一般需要经过以下的几个步骤 数据的采集和获取 数据的清洗,抽取,变形和装载 数据分析,探索和预测 数据的展现 其中

jopen 2014-05-30   174263   0

数据分析/数据挖掘/机器学习---- 必读书目 经验

总结一下我读过的机器学习/数据挖掘/数据分析方面的书,有的适合入门,有的适合进阶,没有按照层次排列,先总结一下,等总结的差不多了再根据入门--->进阶分块写。下面列的书基本上我写的都是读完过的,不然不敢写,怕误人子弟

数据分析需要把hbase、mysql等数据导入hive吗? 经验

看做什么,如果不需要对数据进行实时处理,那么大部分情况下都需要把数据从hbase/mysql(数据库)“导入”到hive(数据仓库)中进行分析。 “导入”的过程中会做一些元数据转换等操作。 相关知识如下

jannyarj 2016-02-17   24504   0

FiloDB:用于大数据分析的分布式数据 资讯

了用于大数据分析的分布式数据库FiloDB,对其主要特点和所包含模块进行了分析。 在当今的大数据时代,越来越多的企业需要对结构化的数据进行分析和查询,需要对流数据进行快速处理和更新。以视频分析为例,

jopen 2015-11-05   24157   0
FiloDB  

数据挖掘,数据分析,人工智能及机器学习课程汇总 经验

问答 数据科学是什么? 7 我怎样才能成为一个数据科学家? 4 科学数据是如何从传统的统计分析不同吗? 1 相关课程 计算数据概念,伯克利分校 9 实用机器学习,伯克利分校 4 人工智能伯克利分校 1

jopen 2015-01-09   35211   0

数据系统数据采集产品的架构分析 经验

任何完整的大数据平台,一般包括以下的几个过程: 数据采集 数据存储 数据处理 数据展现(可视化,报表和监控) 其中,数据采集是所有数据系统必不可少的,随着大数据越来越被重视,数

jopen 2015-11-02   40026   0

9本学习数据挖掘与数据分析的免费书籍 资讯

sciences and subjects. Learn: 10 Ways to Learn Java in just a Couple of Weeks In reality, platforms

jopen 2014-08-05   17746   0

什么数据库最适合数据分析 资讯

数据分析师都想使用数据库作为数据仓库处理并操作数据,那么哪一款数据库最合适分析师呢?虽然网上已经有很多对各种数据库进行比较的文章,但其着眼点一般都是架构、成本、可伸缩性和性能,很少考虑另一个关键因素:

jopen 2015-12-30   6754   0

Spark SQL 初探: 使用大数据分析2000万数据 经验

使用Spark SQL分析数据 去年网上曾放出个2000W的开房记录的数据库, 不知真假。 最近在学习Spark, 所以特意从网上找来数据测试一下, 这是一个绝佳的大数据素材。 如果数据涉及到个人隐私,请尽快删除,

jopen 2014-12-11   177140   0
P6

  大数据下的数据分析平台架构 文档

大数据下的数据分析平台架构 随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代,数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB,对这些海量数据的分析已经成为一个非常重要且紧迫的需求。

shuixian0626 2012-07-06   4913   0

Python科学计算工具包:NumPy 经验

NumPy几乎是一个无法回避的科学计算工具包,最常用的也许是它的N维数组对象,其他还包括一些成熟的函数库,用于整合C/C++和Fortran代码的工具包,线性代数、傅里叶变换和随机数生成函数等。N

jopen 2014-07-29   37621   0

Delphi工具包 jazz sdk 经验

jazz sdk 是一些 Delphi (Object Pascal) 的工具包,主要提供以下几个组件: VTF - Value Type Framework 值类型框架 OPF - Object Persistent

fmms 2012-01-18   74859   0

Ruby的JSON工具包 Kwalify 经验

Kwalify 是一个用来处理 YAML 和 JSON 数据的解析、验证和数据绑定的 Ruby 开发包。 项目主页: http://www.open-open.com/lib/view/home/1324204609468

openkk 2011-12-18   13681   0

Delphi的JSON工具包 SuperObject 经验

SuperObject 是开源的 Delphi 的 JSON 工具包,可生成 JSON 数据以及进行 JSON 解析。 项目主页: http://www.open-open.com/lib

openkk 2011-12-18   36311   0

Erlang HTTP 工具包 MochiWeb 经验

MochiWeb是一个用来构建Web应用的轻便,高效的HTTP应用框架的Erlang库。

openkk 2011-12-13   30685   0

Objective-C工具包 ConciseKit 经验

ConciseKit 是一组 Objective-C 的附加组件和宏,用于简化编码工作。

jopen 2012-06-26   20079   0

Linux C 的工具包:JustKit 经验

JustKit 是一个简单易于使用的 Linux C 的工具包, 主要包括以下工具: 1) HashTable 2) ThreadPool 3) AIO 4) AVL Tree 5) Timer 6)

jopen 2014-01-22   10557   0
1 2 3 4 5 6 7 8 9 10