开源项目,开源代码,开源文档,开源新闻,开源社区

人英雄主义转变为集团作战，英雄难觅，普通人确很容易寻找。就如超强一体机和普通PC Server对比，一个价格高昂甚至需要定制,价格高到连淘宝这样的土豪公司都难以承受,提出去IOE的口号,Oracle一体机确实比较贵

dongpo 2016-01-27 21195 0

分布式/云计算/大数据

值得关注的有：改进使用 Kafka 消息总线的性能和 offset 管理支持 Spark Streaming 的可靠接收器 Kryo 序列化的提升删除流时提供清理 Rabbit 队列/主题的清理选项

dy223 2015-03-26 7175 0

Spring XD

P48

流式计算：对采集到的数据进行实时分析，选用apache的storm 4.数据输出：对分析后的结果持久化，暂定用mysql 对应的大数据组件架构是： Zookeeper+Flume-ng+Kafka+Storm+Mysql

sum154346 2017-07-25 1698 0

分布式/云计算/大数据方案报告 Apache Clojure

编者按今天是Hadoop十岁生日。于2006年1月28日诞生的它改变了企业对数据的存储、处理和分析的过程，加速了大数据的发展，形成了自己的极其火爆的技术生态圈，并受到非常广泛的应用。InfoQ策划

jopen 2016-01-28 56044 0

大数据 Hadoop

为了解决这一问题我们使用了聚类分析算法。聚类分析算法的基本原理是将相似程度高的样本归到一类。这一算法是非监督式的所以我们不需要进行数据标记和提供数据。具体的聚类分析算法有很多种，这里我们使用的是Density-

jopen 2015-07-17 12235 0

Netflix

Learning Summer School》介绍：每天请一个大牛来讲座，主要涉及机器学习，大数据分析，并行计算以及人脑研究。 https://www.youtube.com/user/smolix （国内或许不能访问）

jopen 2015-04-23 325900 0

机器学习

员提供强大的工具来编排无状态的Docker容器。虽然有多个计划将项目的范围扩展到更多的工作负载(如分析和有状态的数据服务)，但这些计划仍然处于非常早期的阶段，还有待观察。 Apache Mesos

MilfordBeni 2017-08-03 38234 0

Mesos Docker Kubernetes

问题和实际客观因素等等一系列的考虑点综合下来才能完成决策。所以，接下来我们先从语言开始，一步一步来分析下在你的项目中选择Go是否合适。 Go在高并发编程方面无疑是出众的，通过goroutine从语

jopen 2015-09-24 41484 0

程序员

支持的存储策略，不同的策略，存储方式是不同的。用户可以针对不同类型的文件，定制相应的存储策略。说到异构存储，很多人可能会想到 Spark 社区提出的 Tachyon，它是 Distributed cache system on HDFS，最初是为了解决不同应用程序间共享

码头工人 2015-12-30 20231 0

Hadoop

REDIS REGEX RUBY RUST SCALA SHELL SPARK STORM SWIFT VARNISH VIM WEB前端 WEB安全开源系统

jopen 2014-11-17 156771 0

码农周刊

不过，有些流处理系统提供了额外的功能，使用它们构建复杂实时流处理会更简单。常见的流处理框架包括 Storm 、 Samza 和 Spark Streaming 。关于它们之间的差别，感兴趣的读者可以查看这里、这里和这里

yne7 2015-03-30 20451 0

Kafka 消息系统

P35

tens of minutes Streaming cubing Analyze real-time data Build delay down to seconds Spark 26. Cube by LayerThe

lufeng76 2016-01-28 2682 0

分布式/云计算/大数据 Apache SQL Basic diff

记，支持丰富的代码模版以及外接插件。 2) Storm Codeplex STORM 是一个免费和开源的用于测试 Web 服务的工具，STORM 可以让你： 1. 使用任何现有技术来测试 Web

jopen 2012-10-08 58602 0

Windows

（ELKI）是一款基于Java的开源（AGPLv3）数据挖掘软件。ELKI主要集中于算法研究，重点研究聚类分析中的无监督方法和异常检测。 6. Mallet 是一个基于Java的面向文本文件的机器学习工具

jopen 2016-01-12 35773 0

机器学习

（ELKI）是一款基于Java的开源（AGPLv3）数据挖掘软件。ELKI主要集中于算法研究，重点研究聚类分析中的无监督方法和异常检测。 6. Mallet 是一个基于Java的面向文本文件的机器学习工具

jopen 2015-12-27 31826 0

机器学习

（ELKI）是一款基于Java的开源（AGPLv3）数据挖掘软件。ELKI主要集中于算法研究，重点研究聚类分析中的无监督方法和异常检测。 6. Mallet 是一个基于Java的面向文本文件的机器学习工具

jopen 2015-12-25 38680 0

机器学习数据挖掘

P12

我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。我们定价合理，让每个人都学得起大数据。 3. 友情提示本系列课程主要由Learning.Spark这本书整理而来。本系列课

ngn6 2015-08-12 548 0

Spark 分布式/云计算/大数据

P31

(SQL)OpenTSDB (metrics)MapReduce (Batch)iStream (Streaming)Hive (SQL)Ganglia & MonitorOtherHQueue (Queue)Application

byc2 2014-11-19 1874 0

Hadoop 分布式/云计算/大数据方案 Java SQL

在当前的大数据时代，第一个挑战是海量数据的收集，另一个就是这些数据的分析。数据分析的类型通常有用户行为数据、应用性能跟踪数据、活动数据日志、事件消息等。消息发布机制用于连接各种应用并在它们之间路由消息，例如通过message

jopen 2015-12-31 22385 0

Kafka 消息系统

作定制机器的集群。所以，比如说你想运行Docker Swarm和Spark，你需要为Docker Swarm创建一个集群，再为Spark创建一个集群。这就在数据中心中创建了很多仓库（silos），每个

jopen 2015-03-01 14192 0

Docker

Hadoop平台架构经验

Spring XD 1.1.1 发布，提升 Kafka 总线性能资讯

大数据（离线/实时）计算架构文档

大数据技术的回顾与展望 ——写在Hadoop十周年纪念资讯

Netflix使用的异常服务器侦测技术资讯

机器学习与深度学习资料经验

正确认识Docker、Kubernetes 、Apache Mesos 经验

作为一名Java程序员，我为什么不在生产项目中转向Go 资讯

Hadoop年度回顾与2016发展趋势资讯

码农周刊分类整理经验

用Apache Kafka构建流数据平台的建议经验

Apache Kylin Extreme OLAP Engine for Big Data 文档

一组强大免费或开源的 Windows 工具资讯

25个Java机器学习工具&库经验

25 个 Java 机器学习工具和库资讯

25个Java机器学习工具&库资讯

(12)使用数据分区优化join 文档

基于Hadoop生态技术构建阿里搜索离线系统文档

[Apache Kafka]Kafka简介经验

剖析Docker Swarm和Mesos：是什么？如何结合？有什么优势？资讯

Flink，Spark Streaming，Storm对比分析的相关搜索

关键词

Hadoop平台架构 经验

Spring XD 1.1.1 发布，提升 Kafka 总线性能 资讯

大数据（离线/实时）计算架构 文档

大数据技术的回顾与展望 ——写在Hadoop十周年纪念 资讯

Netflix使用的异常服务器侦测技术 资讯

机器学习与深度学习资料 经验

正确认识Docker、Kubernetes 、Apache Mesos 经验

作为一名Java程序员，我为什么不在生产项目中转向Go 资讯

Hadoop年度回顾与2016发展趋势 资讯

码农周刊分类整理 经验

用Apache Kafka构建流数据平台的建议 经验

Apache Kylin Extreme OLAP Engine for Big Data 文档

一组强大免费或开源的 Windows 工具 资讯

25个Java机器学习工具&库 经验

25 个 Java 机器学习工具和库 资讯

25个Java机器学习工具&库 资讯

(12)使用数据分区优化join 文档

基于Hadoop生态技术构建阿里搜索离线系统 文档

[Apache Kafka]Kafka简介 经验

剖析Docker Swarm和Mesos：是什么？如何结合？有什么优势？ 资讯

Flink，Spark Streaming，Storm对比分析 的相关搜索

关键词

Hadoop平台架构经验

Spring XD 1.1.1 发布，提升 Kafka 总线性能资讯

大数据（离线/实时）计算架构文档

大数据技术的回顾与展望 ——写在Hadoop十周年纪念资讯

Netflix使用的异常服务器侦测技术资讯

机器学习与深度学习资料经验

Hadoop年度回顾与2016发展趋势资讯

码农周刊分类整理经验

用Apache Kafka构建流数据平台的建议经验

一组强大免费或开源的 Windows 工具资讯

25个Java机器学习工具&库经验

25 个 Java 机器学习工具和库资讯

25个Java机器学习工具&库资讯

基于Hadoop生态技术构建阿里搜索离线系统文档

[Apache Kafka]Kafka简介经验

剖析Docker Swarm和Mesos：是什么？如何结合？有什么优势？资讯

Flink，Spark Streaming，Storm对比分析的相关搜索