数据可挖掘的知识类型 经验

一、概念/类 描述 概念/类描述就是通过对某类对象关联数据的汇总,分析和比较,用汇总的简洁的精确的方式对此类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为:特征性描述和区别性描述。

jopen 2015-01-10   25357   0
P18

  JProbe 使用说明记录 文档

多多加入自己的思考.如有错误或者不足之处,诚挚的希望能够给出意见. JPROBE使用说明记录 2 一、总述 2 二、分析工具选择 2 三、JProbe Memory Debugger 2 3.1主要功能: 2 3.2使用步骤及说明:

stevending 2012-02-09   3874   0

看看 Medium 的开发团队用了哪些技术? 资讯

作时生成。我们通过在图中游走来过滤和推荐文章。 数据平台 早期我们对数据非常渴望,不断尝试数据分析框架来辅助商业和产品决策。最近我们则是利用同样的框架来反馈产品系统,支持Explore等数据驱动功能。

jopen 2016-01-28   32998   0

Medium开发团队谈架构设计 资讯

作时生成。我们通过在图中游走来过滤和推荐文章。 数据平台 早期我们对数据非常渴望,不断尝试数据分析框架来辅助商业和产品决策。最近我们则是利用同样的框架来反馈产品系统,支持Explore等数据驱动功能。

jopen 2015-11-30   32585   0
设计  

华为:坚持开源路线,我们已不再是跟随者 资讯

为也成为了 OCI 开源项目的创始会员。而在大数据领域,华为也通过开源 Astro 项目推动 Spark 在业界的广泛应用。 企业面向云计算的转型,需要实现资源的融合,应用和数据的融合,而开源可以

jopen 2015-11-12   19053   0
华为  
P22

  天津贵金属总裁决策信息平台 文档

易环境的健康发展,并达到扩大自身收益的目标?思考 4. 我们需要这样一款产品数据 对比数据展示和统计数据分析相关性分析趋势预测风险预警数据 构成数据 趋势数据 排行调整交易所服务制定经营策略数据 分布

huhucat 2014-10-12   1085   0

J2EE常用的JAR及开源项目 经验

。 Apache Ant~构建工具,用来完成大量其它任务如文档生成和测试执行等。 Antlr~语法分析器,例如帮助hibernate执行Hql语句。 AOP Alliance~AOP联盟AOP Alliance(

jopen 2014-03-15   93032   0
P133

  Hadoop快速入门 文档

由于上述多种考虑需要取舍,数据可能并不会均匀分布在DataNode中。HDFS为管理员提供了一个工具,用于分析数据块分布和重新平衡DataNode上的数据分布。HADOOP-1652的附件中的一个PDF是一个简要的rebalancer管理员指南。

beanshell 2011-07-16   599   0

如何在 Scala 中科学地操作 collection 经验

的形式且每个元素的键不重复的时候,选择 Map 。 集合中方法的使用 各集合操作之间的比较 在开始介绍不同方法的使用场景之前,我们先对比一下不同方法操作同一集合所产出的结果有何异同。 map 、 filter 、 collect 的比较

604687854 2017-03-23   87858   0

16个用于工作和娱乐的最有用开源软件 资讯

built-in SWF Producer these AVIs can be turned into Streaming Flash videos (SWFs) relatively easy. 7. Mozilla

jopen 2014-08-15   16429   0

Gulp使用入门 经验

中配置好路径等一些参数,运行以下命令就可以自动执行。 grunt takeName Gulp是一款 The streaming build system(流式构建系统),如果说 Grunt 是基于 gruntfile.js

jopen 2015-11-12   10496   0

Go语言框架,类库,软件汇总:awesome-go 经验

Kademlia DHT implementation. go-peerflix - Video streaming torrent client. Email Libraries that implement

jopen 2015-12-28   108215   0
P2

  openfire+smack_简单的_发送消息_demo及各种错误解决方案 文档

昨天搭建好了,openfire准备用写一个smack写一个发送消息的demo,为了方便接收端使用Spark。 使用eclipse的同学注意,创建项目时注意要吧smack与smackx两个包都导进来,只导入smack的话会出现一个

hazhangha 2013-05-06   5215   0

计算无敌!阿里云377秒完成100TB数据排序:秒三星百度 资讯

年排序竞赛的最终成绩。其中,阿里云用不到 7 分钟(377 秒)就完成了 100TB 的数据排序,打破了 Apache Spark 的纪录 23.4 分钟。Sort Benchmark 有全球科技公司“计算奥运会”之称,更早之前

jopen 2015-10-28   5609   0

深入浅出时序数据库之分布式计算 经验

前文提到数据查询特别是大数据量的聚合分析查询是时序数据库需要解决的一个主要问题,之前的文章介绍了通过预处理数据的方法,用空间换时间的思路,降低了大数据量聚合分析的延时。 本文将从分布式计算方向思

鏖战双十一-阿里直播平台面临的技术挑战 资讯

),以及系统可用性、稳定性保障等等方面。本文将针对其中的一些技术细节,抽丝剥茧,希望通过些许文字的分析和介绍,能让大家有所启发。 视频直播 对于直播平台来说,为了保障各种网络环境下能够流畅的观看视

jopen 2016-01-27   45649   0

微博“异地多活”部署经验谈 经验

机房之间的延时:微博北京的两个核心机房间延时在1ms左右,但北京机房到广州机房则有近40ms的延时。对比一下,微博核心Feed接口的总平均耗时也就在120ms左右。微博Feed会依赖几十个服务上百个资源,如果都跨机房请求,性能将会惨不忍睹;

n342 2015-04-29   22765   0
微博  

美团推荐算法实践 经验

和重排序两层进行了解耦,这两层的结果是正交的,因此可以分别进行对比试验,不会相互影响。同时在每一层的内部,我们会根据用户将流量划分为多份,支持多 个策略同时在线对比。 数据应用 数据乃算法、模型之本。美团作为一

jopen 2015-01-22   29020   0

去哪儿网支付系统架构演进 经验

化的拆分,而且需要支持更复杂的业务。 2.1 服务化拆分 2.1.1  网关拆分 首先对相对比较独立的网关进行拆分,网关在整个支付系统中属于底层基础服务,是比较重要的基础设施。对外能够提供怎么

AlannahHerr 2017-01-09   31764   0
P14

  机器视觉模块说明文档b 文档

使图像中的像素值分布平均。主要是用于改变整个图像的平均灰度值。 3.1.4 BCGLookup 图像的亮度,对比度和非线性的校准。其中的BCG分布代表brightness, contrast, and gamma

focus2046 2015-04-09   2639   0
1 2 3 4 5 6 7 8 9 10