分布式计算框架:Google Cloud Dataflow 经验

以读取BigQuery以进行表连接等操作。如果想在Dataflow上使用一些开源资源(比如说 Spark中的机器学习库),也是很方便的 为了配合Dataflow, Google Cloud Platform

Github上关于大数据的开源项目、论文等合集 资讯

originally developed at AddThis. AMPLab SIMR - run Spark on Hadoop MapReduce v1. Apache Crunch - a simple

jopen 2014-08-20   57775   0
Github  

Paracel:豆瓣开发的大型分布式计算框架,用于机器学习、图算法 经验

Paracel和Spark/GraphLab的主要区别是什么? Spark 和GraphLab都是非常成功的分布式计算框架,它们各自有着很多吸引用户的优点,但也存在一些局限性。Spark提出了RDD的概念并赋予其一系列的

yne7 2015-03-30   17278   0

Mesos 架构与去哪儿的统一框架实践 经验

内核相同的设计原则,只是设计在不同的抽象层级上。它运行在一个机房的所有服务器上并且通过 API 的形式给应用(比如 Hadoop,Spark,Kafka,Elastic Search)提供资源管理、计划任务等功能。 Mesos 是一个在

shenxidd 2016-12-30   9432   0

7 个你应该知道的Java工具 资讯

retrieve her favorite recipes. 6. Spark – 微型Web框架 Back to pure Java, Spark is a Sinatra inspired micro web

jopen 2014-10-18   14303   0

Apache Drill 1.0发布 资讯

虽然大数据往往将关系型数据库当作靶子,但事实上真正生产环境的Hadoop和Spark等大数据平台,每天大部分工作仍然是为SQL查询提供服务,所以,SQL on Hadoop就成了竞争最激烈的技术领域。

jopen 2015-05-20   10665   0
P8

  《2016数据科学从业者薪酬调查报告》摘要解读 文档

Science Salary Survey),调查报告表明: 相比其它工具,使用Python和 Spark的人薪水更高。 · SQL, Excel, R 和 Python 最常用的工具. · 开会越多的人,通常薪水也越高。

wpwan 2016-12-10   603   0
报告   Apache   Python   Scala   SQL  

简单的实时大规模机器学习基础架构:Oryx 经验

目前Owen还在花费大量时间担当Apache Spark目 的贡献者,他想重写Oryx,将Spark而不是MapReduce作为主要的处理框架,因为Spark已经成为下一代大数据应用的热门技术。由于性能

jopen 2014-03-01   24541   0

数据仓库系统,Shark 0.2 发布 资讯

Shark 是一个大型的数据仓库系统为 Spark 的设计与 Apache Hive 兼容。它处理 Hive QL 的性能比 Apache Hive 快 30 倍。支持 Hive 查询语言、元存储、序列化格式和用户自定义函数。

jopen 2012-10-22   12686   0
Shark  

雅虎如何在Hadoop集群上实现大规模分布式深度学习 资讯

集群上执行,可以避免数据在 Hadoop 集群和单独的深度学习集群之间移动; 同 Hadoop 数据处理和 Spark 机器学习管道一样,深度学习也可以定义为 Apache Oozie 工作流中的一个步骤; YARN

vgtr 2015-10-27   15225   0
Hadoop  
P9

  openfire应用和开发指南 文档

Windows Exodus, Pandion, Psi, Spark Linux Gajim, Gossip, Kopete, Pidgin, Psi, Spark, Tkabber Macintosh Adium

tumeimey 2016-05-10   650   0

Apache SystemM v0.10.0-incubating 发布,一个机器学习语言 资讯

语言,使用Java编写。可实现三大功能:(1) 可定制算法;(2) 多个执行模式,包括单个,Hadoop 批量和 Spark 批量;(3) 自动优化。 SystemML的机器学习主要基于两方面: SystemML 语言,声明式机器学习

jopen 2016-06-18   9116   0

2014-2015年排名前10位的基于Java的Web框架 资讯

Spring MVC/Spring Boot Grails Dropwizard Vert.x Play Spark Vaadin Ninja Jodd jHipster In order to infer the

jopen 2014-11-17   279294   0
Java  

R、Python、Scala 和 Java,到底该使用哪一种大数据编程语言? 经验

lot2。而如果你想利用比你机器提供的功能还强大的功能,那可以使用SparkR绑定,在R上运行Spark。 然而,如果你不是数据科学家,之前也没有用过Matlab、SAS或OCTAVE,可能需要一

bencker 2016-04-24   43890   0

Transformer架构解析 经验

Pipeline形成的过程(Pipeline的概念在后续会有定义)。典型的例子比如你开发的一个Spark Streaming程序,一个Storm程序,一个Tomcat Web服务,都是一个Transformer。

JanaColechi 2016-01-31   8059   0
P63

  Flex4 案例集合 文档

下面是main.mxml: 案例十七、 Flex 4中如何通过backgroundColor样式,设置Spark SimpleText背景颜色 下面是main.mxml: 案例十八、 Flex 4中如何通过静态的TextFlowUtil

paopao 2011-11-01   5878   0

A16Z 750万美元投资分布式文件系统Tachyon 资讯

件系统,能够为集群框架(如Spark、MapReduce)提供可靠的内存 级速度的文件共享服务,具有类Java的文件API、兼容Hadoop MapReduce和Spark、底层文件系统可插拔等特性。

jopen 2015-03-18   8585   0
Tachyon  

彦伟:京东实时数据平台架构设计与实现思路 资讯

次接入多次消费。 实时计算 ,我们经过调研之后,选择基于Storm打造这个平台。这是参考了Spark Streaming和Storm的稳定性、社区活跃度以及它们在国内应用的现状。Storm应该是最

jopen 2015-12-18   33498   0
架构  
P25

  Apache Hadoop2.0 下一代数据处理框架介绍 文档

资源利用率低 多计算框架各自为战,数据共享困难 MR:离线计算框架 Storm:实时计算框架 Spark:内存计算框架 7. Hadoop2.0 新特性: YARN-架构及组件ResourceManager

pnx8 2014-08-17   3282   0

Java 微型Web框架:sparkjava 经验

,用于采用Java快速快速创建Web应用。 import static spark.Spark.*; import spark.*; public class HelloWorld { public static

jopen 2014-05-14   42603   0
1 2 3 4 5 6 7 8 9 10