开源项目,开源代码,开源文档,开源新闻,开源社区

http://my.oschina.net/u/2605101/blog/608842 本文尝试使用Spark提供的机器学习算法 Gradient-Boosted Trees来预测一个用户是否会点击广告。

ThaPullen 2016-01-25 27738 0

机器学习

http://lxw1234.com/archives/2016/01/605.htm 关键字：spark mllib、文本分类、朴素贝叶斯、native bayes 文本分类是指将一篇文章归到事先定义好

PeggyScarbe 2016-01-23 137933 0

机器学习

ache-spark-1.3-released Apache Spark项目刚刚发布了1.3版本。该版本主要的功能改进包括新增DataFrames API，更加成熟的Spark SQL，机

jopen 2015-03-24 23841 0

Apache Spark

P24

1. MLlib在淘宝的应用和改进淘宝技术部数据挖掘与计算——高性能计算洪奇明风 2. 主要内容决策树 AdaBoost 多分类 3. 决策树 4. 基本算法 5. 应用场景淘宝用户类型判断购买

koel 2015-11-22 1200 0

P33

1. MLlib在淘宝的应用和改进淘宝技术部数据挖掘与计算——高性能计算洪奇明风 2. MLlib在淘宝分类&回归朴素贝叶斯决策树线性模型协同过滤ALS聚类KMeans关联规则FPGrowth降

pd3n 2014-12-02 2613 0

数据挖掘

P24

1. MLlib在淘宝的应用和改进淘宝技术部数据挖掘与计算——高性能计算洪奇明风 2. 主要内容决策树 AdaBoost 多分类 3. 决策树 4. 基本算法 5. 应用场景淘宝用户类型判断购买

n2n3 2015-01-19 295 0

12月18日，Spark宣布发布1.2版本，和以往发布的版本相比，1.2版本算得上是最大的一次改进，代码来自172个开发者的多达一千次提交。更新内容涵盖核心性能改进、MLlib的新API、Stream

jopen 2014-12-24 7849 0

Spark

本文主要讨论是用MLlib进行Classification工作。典型的应用场景就是AD CTR Prediction，也就是大部分互联网公司的利润来源。据业余了解，广告CTR预估使用最多的基础算法还是L1正则化的Logistic

jopen 2014-12-27 51748 0

机器学习

Spark是一个开源，跨平台IM客户端。它的特性支持集组聊天，电话集成和强大安全性能。如果企业内部部署IM使用Openfire+Spark是最佳的组合。

码头工人 2019-01-17 1886 0

聊天工具

Spark是一个源于Sinatra的微型Web开发框架，用于以最小的代价快速开发Web应用。 Sinatra是一个基于Ruby语言，以最小精力为代价快速创建web应用为目的的DSL（领域专属语言）。

码头工人 2019-01-17 918 0

Web开发框架

P38

讲师：孙帅(suns) 2. 课程大纲 Spark基础 RDD Spark on Yarn Spark Streaming Spark SQL 3. Spark基础one stack to rule them

516304276 2016-11-23 980 0

SQL Basic

P2

Spark采用一个统一的技术堆栈解决了云计算大数据的如流处理、图技术、机器学习、NoSQL查询等方面的所有核心问题，具有完善的生态系统，这直接奠定了其一统云计算大数据领域的霸主地位；要想成为Spark高手，需要经历六大阶段：

chen_xyun 2016-10-13 2098 0

分布式/云计算/大数据

同时将一些java 程序转为Scala的程序将平台上的代码减少了很多，在实施的过程中，开到一些Spark相关的YARN的部署上都是基于之前的Hadoop 1.x的部分方式，在Hadoop2.2 +版本之上

jopen 2015-01-10 29664 0

Spark 分布式/云计算/大数据

Introduction 本文主要讨论 Apache Spark 的设计与实现，重点关注其设计思想、运行原理、实现架构及性能调优，附带讨论与 Hadoop MapReduce 在设计与实现上的区别

jopen 2014-08-26 21013 0

Spark 分布式/云计算/大数据

P17

Openfire+Spark+Spark Web安装配置一．安装环境操作系统：Windows XP Prefessional SP2 服务器软件：Openfire 3.4.2 Openfire

tumeimey 2016-05-07 3792 0

电话/通讯/IM聊天 Openfire

Spark Kernel 的最主要目标：提供基础给交互应用程序联系和使用 Apache Spark。几个主要特性：定义和运行 Spark 任务以类似 Scala REPL 和 Spark

ynnc 2015-07-28 20226 0

分布式/云计算/大数据 Apache Spark

Spark SQL允许相关的查询如SQL，HiveQL或Scala运行在spark上。其核心组件是一个新的RDD：SchemaRDD，SchemaRDDs由行对象组成，并包含一个描述此行对象的每一列

jopen 2014-12-01 18689 0

Spark SQL 分布式/云计算/大数据

改进，如Pig，Cascading，JAQL，OOzie，Tez，Spark等。 Apache SparkApache Spark是一个新兴的大数据处理的引擎，主要特点是提供了一个集群的分布式内存抽象，以支持需要工作集的应用。

jopen 2015-11-21 34595 0

Hadoop

9789 二、Spark1.5.1安装 1.下载spark1.5.1 http://spark.apache.org/downloads.html 选择spark的版本 [hado

gotogether 2016-01-27 16758 0

分布式/云计算/大数据

基本概念和原则首先，要搞清楚Spark的几个基本概念和原则，否则系统的性能调优无从谈起：每一台host上面可以并行N个worker，每一个worker下面可以并行M个executor，ta

jopen 2016-01-19 77909 0

Spark 分布式/云计算/大数据

Spark MLlib实现的广告点击预测–Gradient 经验

Spark MLlib实现的中文文本分类–Native Bayes 经验

Apache Spark 1.3发布，新增Data Frames API，改进Spark SQL和MLlib 资讯

MLlib在淘宝的使用和改进文档

MLlib 在淘宝的使用和改进文档

MLlib 在淘宝的使用和改进文档

Spark 1.2版本发布： MLlib支持工作流，SQL支持源数据筛选资讯

研究机器学习之MLlib实践经验经验

Spark 开源项目

Spark 开源项目

spark 文档

spark高手文档

Spark on Yarn 经验

Spark Internals 经验

openfire+spark+spark-web安装配置文档

提供程序使用 Apache Spark 的基础：Spark Kernel 经验

Spark SQL 代码简要阅读（基于Spark 1.1.0）经验

Hadoop VS Spark 资讯

【Spark 1.5.1】安装经验

Spark的性能调优经验

Spark MLLib 的相关搜索

关键词

Spark MLlib实现的广告点击预测–Gradient 经验

Spark MLlib实现的中文文本分类–Native Bayes 经验

Apache Spark 1.3发布，新增Data Frames API，改进Spark SQL和MLlib 资讯

MLlib在淘宝的使用和改进 文档

MLlib 在淘宝的使用和改进 文档

MLlib 在淘宝的使用和改进 文档

Spark 1.2版本发布： MLlib支持工作流，SQL支持源数据筛选 资讯

研究机器学习之MLlib实践经验 经验

Spark 开源项目

Spark 开源项目

spark 文档

spark高手 文档

Spark on Yarn 经验

Spark Internals 经验

openfire+spark+spark-web安装配置 文档

提供程序使用 Apache Spark 的基础：Spark Kernel 经验

Spark SQL 代码简要阅读（基于Spark 1.1.0） 经验

Hadoop VS Spark 资讯

【Spark 1.5.1】 安装 经验

Spark的性能调优 经验

Spark MLLib 的相关搜索

关键词

MLlib在淘宝的使用和改进文档

MLlib 在淘宝的使用和改进文档

MLlib 在淘宝的使用和改进文档

Spark 1.2版本发布： MLlib支持工作流，SQL支持源数据筛选资讯

研究机器学习之MLlib实践经验经验

spark高手文档

openfire+spark+spark-web安装配置文档

Spark SQL 代码简要阅读（基于Spark 1.1.0）经验

【Spark 1.5.1】安装经验

Spark的性能调优经验