开源项目,开源代码,开源文档,开源新闻,开源社区

面向四种语言的最佳资源库再加上Java on Hadoop，相信足以帮助大家将机器学习转化为切实可靠的业务工具。在经历了数十年单纯作为专业学科的潜伏期之后，机器学习突然之间在技术前沿与核心领

jopen 2014-08-06 35293 0

机器学习

。 Apache Mesos – 一种可以运行Hadoop MapReduce或者服务型应用的通用集群管理器。 Hadoop YARN – Hadoop 2的集群管理器。另外，使用Spark的 EC2

fyfg0690 2016-02-28 9942 0

Spark 分布式/云计算/大数据

原始数据《专访卢亿雷：谈Hadoop生态的最新发展》：在2016年Hadoop十岁生日之际，InfoQ策划了一个Hadoop热点系列文章，为大家梳理Hadoop这十年的变化，技术圈的生态状况，

jopen 2016-04-12 29688 0

数据挖掘大数据

通过Hive提供的order by子句可以让最终的输出结果整体有序。但是因为Hive是基于Hadoop之上的，要生成这种整体有序的结果，就必须强迫Hadoop只利用一个Reduce来完成处理。这种方式的副作用就是回降低效率。

jopen 2014-01-28 23015 0

Hive 数据挖掘

P3

在过去的十年里，数据处理发生了革命性的变化：MapReduce，Hadoop，以及相关的技术使我们可以存储和处理以前不可想象的大规模的数据。很遗憾，这些数据处理系统都不是实时系统，而且也根本没办法把Hadoop变成一个实时系统；实时数据处

cdmamata 2014-01-13 488 0

分布式/云计算/大数据

mapReduce功能函数只能用javascript编写，并且通过控制台命令执行 8.GridFS文档系统--功能类似于Hadoop的HDFS,实现分布式存储功能四、Hbase HBase基于Google的Big

fmms 2012-02-07 103640 0

NoSQL数据库 NOSQL

的一份报告中透露，摩根士丹利分析师 Katy Huberty 在接受采访时预测，iPhone 8 将会使 2018 年苹果手机销量上涨 20%。值得注意的是， Huberty 的预测是大多数分析师的两倍。花旗银行分析师将苹果的目标股价上调至

jopen 2017-03-15 5370 0

iPhone

多码流切换局部放大缩小帧间、帧内预测模式显示 CU分块模式显示 PU分割模式显示 TU分割模式显示运动向量显示帧内预测模式预测方向显示码率信息显示 v1.4.0

jopen 2014-02-23 11748 0

H.265

iftKey输入法家族根据多年的技术积淀通过算法来预测你的下个词组，而今天公司再次向前迈进一步。此前的SwiftKey只有用户在输入之后才会进行预测，而公司正在研发的新版- -SwiftKey Neural

jopen 2015-10-09 13712 0

SwiftKey Neural

P12

标进行预测。为了实现这一目的，我们需要有一个训练数据集，这个数据集中每个实例的输入和输出都是已知的。观察训练集中的实例，可以建立起预测的模型。有了这个模型，我们就可以新的输出未知的实例进行预测了。衡量模型的好坏就在于预测的准确程度。

pengtz91 2012-03-21 5629 0

的人工智能领域。Google DeepMind 工程师 Jack Rae 预测说，过去被视为对于中型到大型数据集来说最佳的预测算法的那些模型（比如说提升决策树（Boosted Decision Trees）和随机森林）将会变得无人问津。

jopen 2016-01-04 40761 0

机器学习解决问题的一般过程：本文将按照：1）特征表示；2）特征选择；3）基于Naive Bayes分类模型；4）分类预测，四个部分顺序展开。特征表示我们需要先将实际问题转换成计算机可识别的形式。对于POI而言，

jopen 2014-12-18 29362 0

机器学习算法

美元。另一位积极的分析师 Gene Munster 来自派杰（Piper Jaffray），Munster 预测 2014 年苹果股价将达到 1000 美元/股，在这个价位，苹果公司的市值同样高达 9324 亿美元！

fmms 2012-04-04 12643 0

苹果

P7

构建应用系统和分析系统的桥梁，并将它们之间的关联解耦；（2）支持近实时的在线分析系统和类似于Hadoop之类的离线分析系统；（3）具有高可扩展性。即：当数据量增加时，可以通过增加节点进行水平扩展。

vv2011_p 2012-12-21 606 0

日志组件

自由软件用户。在 2009 年，Olson 建立了 Cloudera——第一个利用 Hadoop 牟利的组织，基于谷歌软件基础结构的开源数据运算平台——他用 Apache 许可协议替代了 GPL。Apache

fmms 2012-03-26 8249 0

开源

Spark中迭代式机器学习算法的数据流可以通过图2.3来进行理解。将它和图2.1中Hadoop MR的迭代式机器学习的数据流比较一下。你会发现在Hadoop MR 中每次迭代都会涉及HDFS的读写，而在Spark中则

likeo 2015-04-21 18486 0

Spark 分布式/云计算/大数据

Graphical Model，基本对于现在工业界能用的 Model 都了解 3. 三是我会使用 Hadoop 等工具，这主要得益于第一我选过 Cloud Computing ，这课手把手，还给钱，教使用

jopen 2015-02-03 14236 0

码农

现在，调整配置后不再需要重启，但是目前只支持一部分配置的在线调整，如 Load Balance 和 Compaction。Hadoop 也已经实现了此功能。目前社区的工作方向和趋势：提高可用性很多应用都要求存储具有高可用性，目前

jopen 2016-01-03 22798 0

HBase

提到基础设施搭建，不得不提 Hadoop，在今天，Hadoop 因为其 MapReduce 数据处理速度不够快，已经不再作为大数据处理的首选，但是 HDFS 和 Yarn——Hadoop 的两个组件——倒是越来越受欢迎。Hadoop

pm45e 2015-08-03 38813 1

Python

构建应用系统和分析系统的桥梁，并将它们之间的关联解耦；（2）支持近实时的在线分析系统和类似于Hadoop之类的离线分析系统；（3）具有高可扩展性。即：当数据量增加时，可以通过增加节点进行水平扩展。

jopen 2013-12-11 163521 0

日志系统日志处理

将机器学习带入Java与JavaScript等编程语言的五种方式资讯

《Spark官方文档》集群模式概览经验

大数据与机器学习周报第5期资讯

Hive查询经验

Twitter Storm 环境搭建文档

常用NoSQL比较经验

摩根士丹利：iPhone 8将会使2018年苹果手机销量上涨20% 资讯

HEVC/H.265 可视化分析器，Gitl HEVC 1.4.0 发布资讯

SwiftKey Neural：全球首个人工神经网络输入法资讯

WEKA 使用教程文档

2016深度学习统治人工智能？深度学习十大框架资讯

基于机器学习方法的POI品类推荐算法经验

苹果三年后市值被估值到 1 万亿美元！资讯

开源日志系统比较文档

开源者的信仰正在崩塌资讯

颠覆大数据分析之Spark弹性数据集经验

CMU-CS硕士北美码农求职数据科学家，已拿到Apple Offer 资讯

Apache HBase 2015年发展回顾与未来展望资讯

大数据全栈式开发语言 – Python 资讯

开源日志系统比较：scribe、chukwa、kafka、flume 经验

hadoop 电影票房预测的相关搜索

关键词

将机器学习带入Java与JavaScript等编程语言的五种方式 资讯

《Spark官方文档》集群模式概览 经验

大数据与机器学习周报 第5期 资讯

Hive查询 经验

Twitter Storm 环境搭建 文档

常用NoSQL比较 经验

摩根士丹利：iPhone 8将会使2018年苹果手机销量上涨20% 资讯

HEVC/H.265 可视化分析器，Gitl HEVC 1.4.0 发布 资讯

SwiftKey Neural：全球首个人工神经网络输入法 资讯

WEKA 使用教程 文档

2016深度学习统治人工智能？深度学习十大框架 资讯

基于机器学习方法的POI品类推荐算法 经验

苹果三年后市值被估值到 1 万亿美元！ 资讯

开源日志系统比较 文档

开源者的信仰正在崩塌 资讯

颠覆大数据分析之Spark弹性数据集 经验