开源项目,开源代码,开源文档,开源新闻,开源社区

热的主题之一，其研究成果早已渗透到了日常生活中，从垃圾邮件过滤到人脸支付，从信用欺诈检测到自然灾害预测等场景无一不活跃着机器学习的身影。但即便机器学习已经得到了广泛的应用，开发人员能够从网上找到很多机器学习算法实现，但是这些代码往往

jopen 2015-11-25 38217 0

TensorFlow

一个重要原因。随着Android 最近迁移到了 OpenJDK，以及即将到来的 Java 9，我们预测 Java 的实用性将继续增加。这些生态体系的好处已经明显会引来大量新人，然而，做为老鸟，经

jopen 2016-02-04 14914 0

Java IOS 安卓开发

我们前一阵子参加了在旧金山举办的Dato数据科学峰会。来自业界和学界的千余名数据科学研究人员在大会上对数据科学、机器学习和预测应用方面的最新发展进行了交流和探讨。以下是大会中讨论的数据科学家在未来可能使用的八个Python工具。

jopen 2015-08-28 16610 0

Python

DB）、流计算（StreamCompute）共同组成了底层强大的计算引擎，速度更快，成本更低。经测算，自建Hadoop集群的成本是数加的1.5倍，国外计算厂商AWS 的EMR成本更是数加的5倍。计算引擎之上

jopen 2016-01-19 20052 0

大数据阿里云

。什么是推荐？推荐（Recommendation）是机器学习的一个分支，通过分析数据来预测用户的喜好或者给物品评分。推荐系统在业界被广泛运用：书籍及其它产品（如Amazon）音乐（如Pandora）

jopen 2015-06-17 15837 0

推荐引擎 Apache Mahout

说到。“为了实现这个目标，他们抛弃了关系型数据库。” 大约 80% 的企业现在仍然在使用关系型数据库，Wiederhold 预测这个比例在接下来的 10 到 15 年将会降至不到 50%，企业迁移到 NoSQL 数据库，尤其是

jopen 2015-07-28 8096 0

大数据

是将数据按某种规则分成块，然后对整个块跑计算逻辑，缺点是延迟太高(至少是分钟)，常用的工具就是Hadoop。在日益变化的需求面前，高延迟越来越不能忍受，因此Streaming模式应运而生，他最大的特点

jopen 2016-01-07 68509 0

大数据分布式系统分布式/云计算/大数据

P44

法处理情况下的机器学习工具。在目前阶段，这种可伸缩性由java实现，有些部分基于Apache Hadoop这个分布式计算框架实现。 Mahout是java库。它不支持用户接口，预装好的服务器。以及安装

pcint 2013-07-18 1264 0

来命名，例如把“感知器”称为两层神经网络。但在本文里，我们根据计算层的数量来命名。假如我们要预测的目标不再是一个值，而是一个向量，例如[2,3]。那么可以在输出层再增加一个“输出单元”。下

jopen 2016-01-15 125372 0

深度学习神经网络

P12

。存储的数据通常都具有优化过的存放格式。对于访问一个key所需的磁盘seek操作数也有一个可预测的一致的上界。同时读取该key后面的那些记录也不会再引入额外的seek操作。通常情况下，一个基于L

lanbocui 2012-08-21 604 0

分布式/云计算/大数据

用户行为模式的挖掘和利用，用本质上说，推荐就是在做用户行为模工挖掘，找出用户的行为特征，给出相应的预测，这里面涉及到大量的算法和工程问题。多维数据的交叉利用，除了线上数据，不少客户有自己其他渠道

LoganMadsen 2016-09-12 25930 0

推荐系统软件架构

介绍：入门的书真的很多，而且我已经帮你找齐了。《Sibyl》介绍：Sibyl 是一个监督式机器学习系统，用来解决预测方面的问题，比如 YouTube 的视频推荐。《Deep Learning》介绍：Yoshua

jopen 2016-01-17 112827 0

深度学习

介绍：入门的书真的很多，而且我已经帮你找齐了。《Sibyl》介绍：Sibyl 是一个监督式机器学习系统，用来解决预测方面的问题，比如 YouTube 的视频推荐。《Deep Learning》介绍：Yoshua

xg48 2015-04-12 350748 0

机器学习

客户端的每一个操作我们都会记录到行为日志中，再通过一定的压缩规则，上传到日志服务器中。使用 Hadoop 做离线分析，通过客户端的实时记录预测下一个时间段的交易量。实时数据是通过业务网关主要是 HDBS 的方式上传到服务器上面。

jopen 2015-02-09 16022 0

日志

P34

法就是对节点进行分类，挖掘复杂网络中的隐藏信息。同一个社区中节点具有相似的特性和社会信息。客户流失预测、商品推荐、舆情分析。对万维网中的网页进行分类，有助于提高搜索效率和精确度，有助于信息过滤、热点追

yuyue3295 2017-11-19 951 0

答辩 Intel Java Mathematica

多的现象：横向协作关系过于紧密。每个模型支持不同类型的工作。我认为，垂直协作有利于长期的和可预测的工作。而横向协作有助于偶然情况和“狂野”的想法。我愿意花宝贵时间去编程的理由我比

jopen 2014-07-22 9165 0

编程

数成长型的服务器经销商之一，却很难指望在多方面获得成绩。对于 Rackspace ，我去年的预测是：在2014年底结束前他们会被其他公司并购，果然现在他们已经挂牌出售了，但是还没有找到接手人购买（惠普让我失望了）。他们已经意识

jopen 2015-01-13 27837 0

云平台

P9

上宣布，他们每天的数据净增量达到了1个PB，每个礼拜需要新增1000台服务器存储这些数据。再来看看我们自己公司内部的情况，基于hadoop的云梯一群集已经达到了1400台服务器的规模，淘宝数据仓库的数据量已经达到了1PB（实际存储3

videostorm 2013-10-26 485 0

分布式/云计算/大数据

P10

部分，特别是《Mahout 实战》一书。此外，我假设读者具备 Apache Hadoop 和 Map-Reduce 范式方面的基本知识。（有关 Hadoop 的更多信息，请参阅参考资料部分。） Mahout 现状

beiwei1121 2014-09-23 492 0

机器学习 Apache

格式，同时又遵循scikit-learn的习惯和理念? OG：在创建scikit-learn预测模型时，特征始终是一个关键点。因为pandas数据框的最新版本，我们越来越善于整合工具箱去操纵任何

jopen 2015-10-13 13668 0

机器学习

TensorFlow、DMTK与SystemML孰优孰劣资讯

下一代移动 iOS 和安卓应用程序应该用 java 来编写的8大原因资讯

八大工具，透析Python数据生态圈最新趋势！资讯

阿里云推出“数加”平台开放十年大数据能力资讯

深入了解推荐引擎组件（基于Apache Mahout和Elasticsearch）经验

准备好迎接大数据爆炸时代么？ 3个重要的数据库策略技巧资讯

大数据系列之(一) Streaming模式基础知识经验

mahout in action中文版(最全的) 文档

从单层感知器到深度学习以及深度学习必知的框架经验

HBase Architecture(译)：上文档

百分点亿级个性化推荐系统的发展历程和实践架构经验

近200篇机器学习&深度学习资料分享（含各种文档，视频，源码等）资讯

近200篇机器学习&深度学习资料分享（含各种文档，视频，源码等）经验

殷鹏翔：51信用卡的日志分析变迁史和技术细节经验

基于随机游走和标签传播文档

为什么年事已高的我还在编程？资讯

2014年云大事件回顾：云技术架构、云平台和大数据资讯

一位架构师谈海量计算存储文档

Apache Mahout：适合所有人的可扩展机器学习框架文档

Olivier Grisel谈scikit-learn和机器学习技术的未来资讯

hadoop 电影票房预测的相关搜索

关键词

TensorFlow、DMTK与SystemML孰优孰劣 资讯

下一代移动 iOS 和 安卓应用程序应该用 java 来编写的8大原因 资讯

八大工具，透析Python数据生态圈最新趋势！ 资讯

阿里云推出“数加”平台 开放十年大数据能力 资讯

深入了解推荐引擎组件（基于Apache Mahout和Elasticsearch） 经验

准备好迎接大数据爆炸时代么？ 3个重要的数据库策略技巧 资讯

大数据系列之(一) Streaming模式基础知识 经验

mahout in action中文版(最全的) 文档

从单层感知器到深度学习以及深度学习必知的框架 经验

HBase Architecture(译)：上 文档

百分点亿级个性化推荐系统的发展历程和实践架构 经验

近200篇机器学习&深度学习资料分享（含各种文档，视频，源码等） 资讯

近200篇机器学习&深度学习资料分享（含各种文档，视频，源码等） 经验

殷鹏翔：51信用卡的日志分析变迁史和技术细节 经验

基于随机游走和标签传播 文档

为什么年事已高的我还在编程？ 资讯

2014年云大事件回顾：云技术架构、云平台和大数据 资讯

一位架构师谈海量计算存储 文档

Apache Mahout：适合所有人的可扩展机器学习框架 文档

Olivier Grisel谈scikit-learn和机器学习技术的未来 资讯

hadoop 电影票房预测 的相关搜索

关键词