开源项目,开源代码,开源文档,开源新闻,开源社区

挖掘。Netflix不仅使用 Hadoop、Hive、Pig、Parquet、Presto以及Spark等被广泛采用的开源技术，同时还开发并贡献了一些其他的工具和服务。 Genie ：专为Hadoop

jopen 2015-11-24 31689 0

Netflix

L数据库和DataStax版本的Cassandra)，以及处理流数据的技术(比如Apache Spark)。与此同时，企业继续求助于更传统的数据基础设施，比如甲骨文数据基础设施。正如DB-Eng

jopen 2016-02-28 8148 0

大数据

Mahout同时并行地运行多个MapReduce作业来计算物品的共同出现（Mahout 1.0运行在 Apache Spark之上）。Mahout的 ItemSimilarity作业用对数似然比检验（LLR）来确定哪些共同

jopen 2015-06-17 15837 0

推荐引擎 Apache Mahout

P30

适用于多种框架和应用, 分布式系统内核, 构建一个巨大的静态的计算集群, 资源池, Hadoop、Kafka、Spark等众多framework作为数据处理插件 Kubernetes 专门针对容器集群, 轻量化、模块化、便携以及可扩展

dmc3 2015-07-26 633 0

虚拟化方案 Apache Nginx Go

P24

广告曝光和点击时查询hbase，做日志关联优点：大部分的查询能命中cache 9. 技术选型(5)为何不用： Impala Spark Cassandra 10. 技术方案 – 整体框架 11. 技术方案 – 整体框架每次广告请求分配唯一id

cpp45 2015-01-18 4816 0

NoSQL数据库方案

亚于坊间举行的技术大会，包含了敏捷组织转型、C++重构、敏捷测试体系、持续交付整体解决方案、Spark 执行模型、机器学习、Scala 代码操练。课题五花八门，争辩激烈精彩。临近尾声，洪敏提了

jopen 2015-01-05 7126 0

工具

括 Linux、KVM、MySQL、PostgreSQL、Kubernetes、Hadoop、Spark、TensorFlow 等等。以 KVM 为例，凭借向 KVM 贡献的 patch 数，腾讯云已经连续两年登上

五嘎子 2019-09-18 4703 0

TubeMQ

k，Scalesforce，eBay，当然还有Oracle。Hadoop，Cassandra和Spark，大数据工程的基础框架，无不使用Java或者Scala并且在JVM虚拟机上运行的。如果你想要良好

jopen 2016-02-19 24621 1

P4

观。选中一个Spark组件，点击其"外观"属性旁边的下拉按钮，并按下回车键，再选择"创建外观"将打开一个新建MXML外观的对话框（参见图2）：请注意，你可以创建一个默认的Spark外观的副本，然后

axuyin 2012-03-15 3229 0

Flex开发

而且从Jeff Dean的论文来看，它肯定是支持集群上的训练的。在论文里的例子来看，这个架构有点像Spark或者Dryad等图计算模型。就像写Map-reduce代码一样，我们从高层的角度来定义我们的业

jopen 2015-11-11 34562 0

TensorFlow

Framework http://framework.zend.com/ Apache Spark http://spark.apache.org Flask http://flask.pocoo.org/

jopen 2015-06-03 53638 0

开源项目

件框架。 Apache Mahout ：专注协同过滤、聚类和分类的可扩展算法。 Apache Spark ：开源数据分析集群计算框架。 h2o ：用作大数据统计的分析引擎。 Weka ：用作数据挖掘的

encn 2015-05-20 142799 0

Java Java开发

谷歌它就用的C++实现, 而MapReduce编程模型（是高度抽象的）大体离不开下面这张图. Spark并行运算框架(和Hadoop的MapReduce)的不同点:在于它将中间结果即map函数结果直接放入内存中

jopen 2014-11-17 47213 0

MapReduce 分布式/云计算/大数据

最近做了一个小的mapreduce程序，主要目的是计算环比值最高的前5名，本来打算使用spark计算，可是本人目前spark还只是简单看了下，因此就先改用mapreduce计算了，今天和大家分享下这个例子，也算是对自己写的程序的总结了。

Smith 2016-02-21 16578 0

MapReduce 分布式/云计算/大数据

。由于我们会提供未来发布版本的更详尽的信息，因此大家将会看到我们的承诺来解决很多领域的问题，如Spark组件的实现、可访问性、构建系统集成、性能分析工具以及下一代编译器的集成，这些举措会保证Flex成为企业级RIA应用的首选。

码头工人 2011-09-15 15271 1

Flash Flex

openCypher Morpheus 的基础上（后者将 Cypher 引入到 Apache Spark），并结合来自 LDBC 的G-CORE 的灵感，为用户提供了一种组合图查询语言，支持所有那些功能。这将使

五嘎子 2019-09-20 1558 0

SQL GQL

件框架。 Apache Mahout ：专注协同过滤、聚类和分类的可扩展算法。 Apache Spark ：开源数据分析集群计算框架。 h2o ：用作大数据统计的分析引擎。 Weka ：用作数据挖掘的

my5g 2015-01-07 84238 0

Java资源 Java开发

员使用，而是给业务人员用的，因此处理日常重复性任务有更好的解决方案，比如MapReduce和 Spark。最后一点，因为并行数据库需要在数据分布（计算Hash）和存储格式（比如列存、压缩、索引、页面统计信息等）方面进行较多的处理以便为查询

jopen 2015-07-16 30812 0

架构

了支持多元化需求，我们引入越来越多样的数据存储和分析方案，比如Hive、 MapReduec、Spark 和HBase等，随之带来的管理和监控的挑战越来越严峻，数据安全问题亦是其中最重要的之一。

bger 2015-10-28 30641 0

Apache Eagle

P10

Hortonworks主导开发，运行在YARN上的DAG计算框架 Presto Facebook开源 Shark Spark上的SQL执行引擎 Pig 基于Hadoop MapReduce的脚本语言 Cloudera Impala

guet_lee 2017-01-12 675 0

分布式/云计算/大数据

Netflix的开源文化与技术资讯

吃惊吗？原来这才是大数据的大问题！资讯

深入了解推荐引擎组件（基于Apache Mahout和Elasticsearch）经验

浅谈容器集群管理-从Mesos到Kubernetes 文档

hbase上搭建广告实时数据处理平台文档

张逸：我们推荐的高效工具资讯

万亿级！腾讯大数据组件TubeMQ正式开源资讯

4个理由告诉你Java为何排行第一资讯

Flash Builder4 的快捷方式和调试技巧文档

揭秘TensorFlow：Google开源到底开的是什么？资讯

28万个开源项目之番外篇经验

完整全面的Java资源库（包括构建、操作、代码分析、编译器、数据库、社区等等）经验

Hadoop中MapReduce框架入门经验

使用mapreduce计算环比的实例经验

Flash与Flex路在何方？资讯

SQL 靠边站、GQL 来了：已成为 ISO/IEC 国际标准数据库语言项目资讯

国外程序员整理的Java资源大全经验

云+微服务+新硬件：下一代大规模并行数据库架构风格资讯

Apache Eagle：分布式实时 Hadoop 数据安全方案资讯

大数据平台技术框架选型分析文档

Spark MLLib 的相关搜索

关键词

Netflix的开源文化与技术 资讯

吃惊吗？原来这才是大数据的大问题！ 资讯

深入了解推荐引擎组件（基于Apache Mahout和Elasticsearch） 经验

浅谈容器集群管理-从Mesos到Kubernetes 文档

hbase上搭建广告实时数据处理平台 文档

张逸：我们推荐的高效工具 资讯

万亿级！腾讯大数据组件TubeMQ正式开源 资讯

4个理由告诉你Java为何排行第一 资讯

Flash Builder4 的快捷方式和调试技巧 文档

揭秘TensorFlow：Google开源到底开的是什么？ 资讯

28万个开源项目之番外篇 经验

完整全面的Java资源库（包括构建、操作、代码分析、编译器、数据库、社区等等） 经验

Hadoop中MapReduce框架入门 经验

使用mapreduce计算环比的实例 经验

Flash与Flex路在何方？ 资讯

SQL 靠边站、GQL 来了：已成为 ISO/IEC 国际标准数据库语言项目 资讯

国外程序员整理的Java资源大全 经验

云+微服务+新硬件：下一代大规模并行数据库架构风格 资讯

Apache Eagle：分布式实时 Hadoop 数据安全方案 资讯

大数据平台技术框架选型分析 文档