开源项目,开源代码,开源文档,开源新闻,开源社区

数。为了适应不同的集群环境，DMTK框架支持两种进程间的通信机制：MPI和ZMQ。应用程序端不需要修改任何代码就能够在这两种方式之间切换。DMTK支持Windows和Linux两种操作系统。 DM

jopen 2015-12-31 38993 0

机器学习

的基础上演变而来的 Spark ：是一个基于内存计算的开源的集群计算系统，其目的在于，让数据分析更加快速。Spark 是由加州大学伯克利分校的 AMP 实验室采用 Scala 语言开发而成。Spark 的内存计

PattiMaes 2016-01-31 44323 0

大数据 MapReduce 分布式/云计算/大数据 NOSQL

P57

3报废了，6章的代码被我整理成本书第7章的SocialStalkr示例，而且我为了使用Flex 4和Spark组件又重写了一遍。我还认识到，本书其余部分最好的形式是采用一个虚拟实训课的形式。我觉得做一个漫画

chenhb 2011-08-07 774 0

Flex Flex开发

P57

3报废了，6章的代码被我整理成本书第7章的SocialStalkr示例，而且我为了使用Flex 4和Spark组件又重写了一遍。我还认识到，本书其余部分最好的形式是采用一个虚拟实训课的形式。我觉得做一个漫画

qaxx87029675 2013-11-25 2690 0

Flex开发

根，或者log2(特征数)+1，在scikit-learn的实现中，支持sqrt与log2，而spark还支持onethird(1/3)。在结点进行分裂的时候，除了先随机取固定个特征，然后选择最

jopen 2016-01-20 22355 0

算法

生态组件。以腾讯云上开放的弹性 MapReduce 服务为例，腾讯提供了 Hadoop、HBase、Spark、Hive、Presto、Storm、Flink、Sqoop 等组件服务。不同组件也发挥了不同的用处：数据存储和计算资源调度由

jopen 2018-07-11 15687 0

Hadoop 腾讯

(Bulk Synchronous Parallel mode) 基于 Apache Spark 的 Spark 模式新版本改进记录包括： New Features [MRQL-72] Add support

jopen 2016-03-03 10123 0

评估参数并进行推断。数据分析/数据可视化 MLlib in Apache Spark—Spark下的分布式机器学习库 Scalding —CAscading的Scala接口

jopen 2014-08-29 50641 0

机器学习

扩展并对查询性能进行了优化。 9、Spark ——Apache Software Foundation中最活跃的项目，是一个开源集群计算框架。 Spark 是一种与 Hadoop 相似的开源集

fkol7746 2017-05-16 44594 0

分布式系统 Java Java开发 NOSQL

va基础设施无缝集成。第四，开源项目的优秀实践有利于Akka的流行和推广。Apache Spark、Apache Flink都已经成为了Apache开源软件基金会的顶级项目，而它们都使用了Akka库，构造软件的高性能和分布式。

wyjqh 2016-02-01 25963 0

分布式/云计算/大数据 AKKA

P34

目录WHY大数据落地被虐实例如何应对案例分享 8. 信心爆棚的进击Hadoop HBase Spark Storm Impala ML 9. 很快感受到森森的恶意 10. 丰富的数据源 11. 权力的游戏

w327 2015-05-25 473 0

分布式/云计算/大数据方案 SQL

Apache Spark Connector: Parallel to the 3.7 release we are releasing our new plugin Hazelcast-Spark connector

jopen 2016-06-18 11390 0

Hazelcast 集群

AMPLab项目，该项目旨在提供一种构建和管理大规模机器学习的通用流程。鉴于AMPLab与Spark项目的紧密联系，该项目的一些想法已在 Apache Spark中初现端倪。基元辨识与构建第一步就是创建基础部件(基石)

jopen 2015-03-13 33778 0

机器学习

规模的数据集（包括数据深度、广度、频度等），数据弹性还只对新技术的兼容，缺乏弹性的应用需要不断配置修改应用来适应不断更新的大数据技术，对于企业来说是时间、资源和金钱上的无底洞。三、透明度对

jopen 2014-08-24 5763 0

大数据

流水化、参数更新索引和训练数据预处理方案等。这些技术使Angel性能大幅提高，达到常见开源系统Spark的数倍到数十倍，能在千万到十亿级的特征维度条件下运行。在系统易用性上，Angel提供丰富的

jopen 2016-12-19 44892 0

腾讯数据挖掘开源

四、Shark 简介：Shark即Hive on Spark，本质上是通过Hive的HQL解析，把HQL翻译成Spark上的RDD操作，然后通过Hive的metadata获取数据库里的表信息，实

ew45 2015-03-12 325553 0

大数据分布式/云计算/大数据

的拖曳布局，组合各种数据源、组件、算法、模型和评估模块，支持各种主流的开源机器学习框架，包括 Spark、Python、R、XGBoost。覆盖特征工程、分类、聚类、回归、关联规则、时间序列等传统机器

jopen 2017-12-18 12801 0

腾讯

DNN（深度神经网络）、CNN（卷积神经网络）、 RNN（递归神经网络），以及 NTM 这样的复杂记忆模型。基于 Spark，与它的整合程度很高。支持 Python 和 C++ 语言。支持分布式计算。作为它的设计初衷，这使得

jopen 2017-01-09 76241 0

Angel DTPAI SeetaFace PaddlePaddle

认可。 Apache Spark 以及大数据时代的来临举个例子，如 Databricks 这家公司，其开发是完全的基于 Apache Spark 项目之上的，而 Spark 这个项目是2009年

jopen 2016-04-13 23499 0

开源 MapReduce

2015年无疑是 Apache Spark 之年。自我们发布上一版大数据版图以来，这个利用了内存处理的开源框架就开始引发众多讨论。自那以后，Spark 受到了从 IBM 到 Cloudera

XZSIsa 2016-04-12 47818 0

大数据分布式/云计算/大数据

大公司开源机器学习框架资讯

大数据架构概览经验

Hello Flex4中文版文档

Hello Flex4 中文版文档

0x0D 随机之美，随机森林经验

Hadoop老矣，为什么腾讯还要花精力在其开源发布上？资讯

Apache MRQL 0.9.6-incubating 发布资讯

Scala 机器学习库经验

给Java开发者的10个大数据工具和框架经验

【Akka】Akka应用调研报告经验

从“被虐”到“落地” - 明略大数据产品演进实践文档

Hazelcast v3.7-EA 发布，一个数据分发和集群平台资讯

大规模机器学习流程的构建与部署经验

大数据弹性应用开发的八项基本原则资讯

腾讯宣布推出第三代高性能机器学习计算平台Angel 并于2017年全面开源资讯

开源大数据处理系统/工具大全经验

继“Angel”开源后，腾讯又开放TDinsight机器学习平台资讯

深度盘点国内四大机器学习开源平台：PaddlePaddle,Angel 资讯

开放式创新的崛起：打造可持续发展的开源软件公司资讯

大数据的明天将驶向何方？经验

Spark修改窗口的相关搜索

关键词

大公司开源机器学习框架 资讯

大数据架构概览 经验

Hello Flex4中文版 文档

Hello Flex4 中文版 文档

0x0D 随机之美，随机森林 经验

Hadoop老矣，为什么腾讯还要花精力在其开源发布上？ 资讯

Apache MRQL 0.9.6-incubating 发布 资讯

Scala 机器学习库 经验

给Java开发者的10个大数据工具和框架 经验

【Akka】Akka应用调研报告 经验

从“被虐”到“落地” - 明略大数据产品演进实践 文档

Hazelcast v3.7-EA 发布，一个数据分发和集群平台 资讯

大规模机器学习流程的构建与部署 经验

大数据弹性应用开发的八项基本原则 资讯

腾讯宣布推出第三代高性能机器学习计算平台Angel 并于2017年全面开源 资讯

开源大数据处理系统/工具大全 经验

继“Angel”开源后，腾讯又开放TDinsight机器学习平台 资讯

深度盘点国内四大机器学习开源平台：PaddlePaddle,Angel 资讯

开放式创新的崛起：打造可持续发展的开源软件公司 资讯

大数据的明天将驶向何方？ 经验

Spark修改窗口 的相关搜索

关键词

大公司开源机器学习框架资讯

大数据架构概览经验

Hello Flex4中文版文档

Hello Flex4 中文版文档

0x0D 随机之美，随机森林经验

Hadoop老矣，为什么腾讯还要花精力在其开源发布上？资讯

Apache MRQL 0.9.6-incubating 发布资讯

Scala 机器学习库经验

给Java开发者的10个大数据工具和框架经验

【Akka】Akka应用调研报告经验

从“被虐”到“落地” - 明略大数据产品演进实践文档

Hazelcast v3.7-EA 发布，一个数据分发和集群平台资讯

大规模机器学习流程的构建与部署经验

大数据弹性应用开发的八项基本原则资讯

腾讯宣布推出第三代高性能机器学习计算平台Angel 并于2017年全面开源资讯

开源大数据处理系统/工具大全经验

继“Angel”开源后，腾讯又开放TDinsight机器学习平台资讯

开放式创新的崛起：打造可持续发展的开源软件公司资讯

大数据的明天将驶向何方？经验

Spark修改窗口的相关搜索