Hadoop平台架构 经验

人英雄主义转变为集团作战,英雄难觅,普通人确很容易寻找。 就如超强一体机和普通PC Server对比,一个价格高昂甚至需要定制,价格高到连 淘宝这样的土豪公司都难以承受,提出去IOE的口号,Oracle一体机确实比较贵

dongpo 2016-01-27   21195   0

Spring XD 1.1.1 发布,提升 Kafka 总线性能 资讯

值得关注的有: 改进使用 Kafka 消息总线的性能和 offset 管理 支持 Spark Streaming 的可靠接收器 Kryo 序列化的提升 删除流时提供清理 Rabbit 队列/主题的清理选项

dy223 2015-03-26   7175   0
P48

  大数据(离线/实时)计算架构 文档

流式计算:对采集到的数据进行实时分析,选用apache的storm 4.数据输出:对分析后的结果持久化,暂定用mysql 对应的大数据组件架构是: Zookeeper+Flume-ng+Kafka+Storm+Mysql

sum154346 2017-07-25   1698   0

大数据技术的回顾与展望 ——写在Hadoop十周年纪念 资讯

编者按 今天是Hadoop十岁生日。于2006年1月28日诞生的它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用。InfoQ策划

jopen 2016-01-28   56044   0

Netflix使用的异常服务器侦测技术 资讯

为了解决这一问题我们使用了聚类分析算法。聚类分析算法的基本原理是将相似程度高的样本归到一类。这一算法是非监督式的所以我们不需要进行数据标 记和提供数据。具体的聚类分析算法有很多种,这里我们使用的是Density-

jopen 2015-07-17   12235   0
Netflix  

机器学习与深度学习资料 经验

Learning Summer School》 介绍:每天请一个大牛来讲座,主要涉及机器学习,大数据分析,并行计算以及人脑研究。 https://www.youtube.com/user/smolix (国内或许不能访问)

jopen 2015-04-23   325900   0

正确认识Docker、Kubernetes 、Apache Mesos 经验

员提供强大的工具来编排无状态的Docker容器。虽然有多个计划将项目的范围扩展到更多的工作负载(如分析和有状态的数据服务),但这些计划仍然处于非常早期的阶段,还有待观察。 Apache Mesos

MilfordBeni 2017-08-03   38234   0

作为一名Java程序员,我为什么不在生产项目中转向Go 资讯

问题和实际客观因素等等一系列的考虑点综合下来才能完成决策。所以,接下来我们先从语言开始,一步一步来分析下在你的项目中选择Go是否合适。 Go在高并发编程方面无疑是出众的,通过goroutine从语

jopen 2015-09-24   41484   0

Hadoop年度回顾与2016发展趋势 资讯

支持的存储策略,不同的策略,存储方式是不同的。用户可以针对不同类型的文件,定制相应的存储策略。 说到异构存储,很多人可能会想到 Spark 社区提出的 Tachyon,它是 Distributed cache system on HDFS,最初是为了解决不同应用程序间共享

码头工人 2015-12-30   20231   0
Hadoop  

码农周刊分类整理 经验

REDIS REGEX RUBY RUST SCALA SHELL SPARK STORM SWIFT VARNISH VIM WEB前端 WEB安全 开源系统

jopen 2014-11-17   156771   0

用Apache Kafka构建流数据平台的建议 经验

不过,有些流处理系统提供了额外的功能,使用它们构建复杂实时流处理会更简单。常见的流处理框架包括 Storm 、 Samza 和 Spark Streaming 。关于它们之间的差别,感兴趣的读者可以查看 这里 、 这里 和 这里

yne7 2015-03-30   20451   0
P35

  Apache Kylin Extreme OLAP Engine for Big Data 文档

tens of minutes Streaming cubing Analyze real-time data Build delay down to seconds Spark 26. Cube by LayerThe

lufeng76 2016-01-28   2682   0

一组强大免费或开源的 Windows 工具 资讯

记,支持丰富的代码模版以及外接插件。 2) Storm Codeplex STORM 是一个免费和开源的用于测试 Web 服务的工具,STORM 可以让你: 1. 使用任何现有技术来测试 Web

jopen 2012-10-08   58602   0
Windows  

25个Java机器学习工具&库 经验

(ELKI)是一款基于Java的开源(AGPLv3)数据挖掘软件。ELKI主要集中于算法研究,重点研究聚类分析中的无监督方法和异常检测。 6. Mallet 是一个基于Java的面向文本文件的机器学习工具

jopen 2016-01-12   35773   0

25 个 Java 机器学习工具和库 资讯

(ELKI)是一款基于Java的开源(AGPLv3)数据挖掘软件。ELKI主要集中于算法研究,重点研究聚类分析中的无监督方法和异常检测。 6. Mallet 是一个基于Java的面向文本文件的机器学习工具

jopen 2015-12-27   31826   0

25个Java机器学习工具&库 资讯

(ELKI)是一款基于Java的开源(AGPLv3)数据挖掘软件。ELKI主要集中于算法研究,重点研究聚类分析中的无监督方法和异常检测。 6. Mallet 是一个基于Java的面向文本文件的机器学习工具

jopen 2015-12-25   38680   0
P12

  (12)使用数据分区优化join 文档

我们提供专业的大数据学习视频,包括Hadoop,SparkStorm,Mahout,机器学习等。 我们定价合理,让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。 本系列课

ngn6 2015-08-12   548   0
P31

  基于Hadoop生态技术构建阿里搜索离线系统 文档

(SQL)OpenTSDB (metrics)MapReduce (Batch)iStream (Streaming)Hive (SQL)Ganglia & MonitorOtherHQueue (Queue)Application

byc2 2014-11-19   1874   0

[Apache Kafka]Kafka简介 经验

在当前的大数据时代,第一个挑战是海量数据的收集,另一个就是这些数据的分析。数据分析的类型通常有用户行为数据、应用性能跟踪数据、活动数据日志、事件消息等。消息发布机制用于连接各种应用并在它们之间路由消息,例如通过message

jopen 2015-12-31   22385   0

剖析Docker Swarm和Mesos:是什么?如何结合?有什么优势? 资讯

作定制机器的集群。所以,比如说你想运行Docker Swarm和Spark,你需要为Docker Swarm创建一个集群,再为Spark创建一个集群。这就在数据中心中创建了很多仓库(silos),每个

jopen 2015-03-01   14192   0
Docker  
1 2 3 4 5 6 7 8 9 10