开源项目,开源代码,开源文档,开源新闻,开源社区

技术保障部架构师的邮件直达阿里集团最高层： “按照数据增量与未来业务增长的情况，云梯1（以Hadoop为底层的集群）系统存储和计算能力将在6月21日到达瓶颈，数据业务将会停滞，淘数据、量子等业务

jopen 2014-10-30 30429 0

云梯分布式/云计算/大数据

域实现最牛的医生……吴明辉介绍，在制造业已经有为某大型制造企业基于设备数据和深度学习做故障的检测和预测的初步探索。吴明辉表示，这虽然是最简单的工作，但是最后的目标会非常令人兴奋。以数据治理为核心

btsv4641 2016-09-01 44457 0

人工智能大数据分布式/云计算/大数据

P57

云计算数据中心通过运行在单独的服务器上的云操作系统对服务器、存储、网络等资源进行虚拟化管理，提供可以自定义的虚拟机，在虚拟机上安装Hadoop、hbase等Nosql分布式数据库集群，对现有的数据ETL采集、清洗、转换、汇总进来，使用海

guet_lee 2017-01-12 1207 0

分布式/云计算/大数据方案报告手册培训

通过构建一个连接人造神经元的系统，我们发现系统可以被训练去认识数据中更高层次的模式，并发挥有用的作用，比如递归、分类、聚类和预测。仅比喻为生物神经元还远远不够。人造神经网络是一系列计算节点，在此数据表示为数字数组，这些数

JustinaPowe 2017-03-09 38001 0

深度学习

以及需要开发和运维更加紧密合作等方面，系统阐述大规模分布式系统运维实践，通过对真实数据进行分析和预测，将判断失误的概率降到最低。基于技术分析优化运维水平，将是一个值得持续探究的课题。 2013

jopen 2014-10-29 36395 0

分布式分布式/云计算/大数据

还有个例子，Quora的兴趣feed排序。 Quora的首页是结合了多个用户隐式反馈的排序模型，给每一种用户行为建立一个预测模型，预测它发生的概率，结合每一种行为带来的长期价值大小，然后加权，即期望价值。这个例子里面的三元素也可定义清楚：

zljljy 2016-12-03 29681 0

推荐系统设计推荐引擎

同时支持离线数据处理和实时数据处理。 Scale out：支持在线水平扩展。为何使用消息系统解耦在项目启动之初来预测将来项目会碰到什么需求，是极其困难的。消息系统在处理过程中间插入了一个隐含的、基于数据的接口层，两

jopen 2015-03-10 38718 0

Kafka 消息系统

同时支持离线数据处理和实时数据处理。 Scale out：支持在线水平扩展。为何使用消息系统？解耦在项目启动之初来预测将来项目会碰到什么需求，是极其困难的。消息系统在处理过程中间插入了一个隐含的、基于数据的接口层，两

jopen 2015-03-10 56968 0

Kafka 消息系统

精准医疗，自动化交易等方向上取得成功，更值得期待。理论和算法研究上的突破通常可遇不可求，更难预测，而且是否真的突破最终也要落实到实际应用中去评判。在计算力和应用上的突破确定性更高一些。我们是瞄准

rebe0078 2017-11-06 25445 0

深度学习

原型设计。如果我们分析Cassandra的数据结构，我们就会发现结构是基于我们期望的数据查询方式而定。在模型设计之初，我们根本不可能去预测它的查询方式，而一旦查询方式改变，我们就必须重新设计列族。产品：Cassandra、HBase

TravisGodin 2016-09-26 38097 0

数据库 NOSQL

P38

98.7-hadoop2-bin.tar.gz上传至“/home/etl/_jyy/” 执行命令： cd /home/etl/_jyy/ tar xfz hbase-0.98.7-hadoop2-bin

moshco 2017-02-06 626 0

分布式/云计算/大数据 x86 Java Go

oschina.net/u/204498/blog/610459 一、Hadoop 2.x 安装 Hadoop 2.x安装 http://my.oschina.net/u/204498/blog/519789

gotogether 2016-01-27 16758 0

分布式/云计算/大数据

这些定义中也有许多不一致之处。有些定义认为机器学习就是根据历史数据建立一个静态的模型，然后可以用于预测未来的数据。另一些则认为随着数据的增加，它是一个随时间不断变化的动态模型。我是比较支持动态说

LatYjk 2017-01-11 10711 0

支持向量机程序员机器学习

P55

Big World4 5. 业务的革新传统业务精准营销更久的历史数据检索统一的征信平台实时风险预警分析预测个性化服务互联网微博推送网盘/云存储服务照片/视频/音频服务社交动态推送电商服务社交动态推送数据成

x56080 2015-11-13 2606 0

NoSQL数据库方案 JSON Go Basic

Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以不考虑内存泄露一样，

Hadoopp 2012-09-28 803 0

JavaScript开发 Jafka

P17

概述本手册包括大数据集群环境搭建的全部环境步骤说明，例如环境准备（操作系统、JAVA环境等）、Hadoop、Spark、NoSQL数据库等。 2 环境准备 2.1 操作系统 l 安装操作系统：操作系统统一采用CentOS_6

Stone1985 2016-07-28 3529 0

分布式/云计算/大数据

P39

中国电信上海理想集团 2. Hadoop系列专题内容: 1、Hadoop是什么？ 2、分布式云存储：HDFS 3、并行计算：MapReduce 4、案例：全球眼中的应用 5、Hadoop集群构建规划Hadoop 与分布式计算Hive与

furenjievip 2012-05-23 2616 0

分布式/云计算/大数据方案 Apache Java C/C++

P5

下载配置Hadoop，hadoop目前只能使用Cloudera CHD3 beat2(hadoop-0.20.2+320.tar.gz) 新建hadoop用户， su hadoop 在hadoop用户的主目录：

xfbxag 2011-08-12 6955 0

Hadoop 分布式/云计算/大数据

P8

前言本文的目的是让一个从未接触Hadoop的人，在很短的时间内快速上手，掌握编译、安装和简单的使用。 2. Hadoop家族截止2009-8-19日，整个Hadoop家族由以下几个子项目组成：成员名

xnbw 2016-01-12 418 0

分布式/云计算/大数据

P6

[root@hadoop4 ~]$ cat /etc/hosts 127.0.0.1 localhost ::1 localhost 192.168.0.106 hadoop4 192

wudawen 2015-09-10 1639 0

分布式/云计算/大数据

探索5K巅峰，云梯架设的飞天之梦经验

明略数据吴明辉：人工智能的核心一定是大数据经验

大数据中心建设方案文档

利用深度学习进行时序数据的异常检测经验

飞天5K实战经验：大规模分布式系统运维实践经验

推荐系统老司机的十条经验经验

Kafka剖析（一）：Kafka背景及架构介绍经验

Kafka剖析(一):高扩展、高吞吐的分布式消息系统初探经验

微博技术大V老师木：软件平台是深度学习计算力突破的关键经验

NoSQL数据库的四大家族经验

hbase-总结文档

【Spark 1.5.1】安装经验

面向开发人员的机器学习指南经验

NoSQL 大数据时代的机遇和挑战文档

海量文件的分布式计算处理方案博客

大数据集群环境搭建-01 文档

HBase技术研究与应用分析文档

CentOS scribe+hdfs安装文档

HDFS+MapReduce+Hive十分钟快速入门文档

Storm0.9.5 安装笔记文档

hadoop 电影票房预测的相关搜索

关键词

探索5K巅峰，云梯架设的飞天之梦 经验

明略数据吴明辉：人工智能的核心一定是大数据 经验

大数据中心建设方案 文档

利用深度学习进行时序数据的异常检测 经验

飞天5K实战经验：大规模分布式系统运维实践 经验

推荐系统老司机的十条经验 经验

Kafka剖析（一）：Kafka背景及架构介绍 经验

Kafka剖析(一):高扩展、高吞吐的分布式消息系统初探 经验

微博技术大V老师木：软件平台是深度学习计算力突破的关键 经验

NoSQL数据库的四大家族 经验

hbase-总结 文档

【Spark 1.5.1】 安装 经验

面向开发人员的机器学习指南 经验

NoSQL 大数据时代的机遇和挑战 文档

海量文件的分布式计算处理方案 博客

大数据集群环境搭建-01 文档

HBase技术研究与应用分析 文档

CentOS scribe+hdfs安装 文档

HDFS+MapReduce+Hive十分钟快速入门 文档

Storm0.9.5 安装笔记 文档

hadoop 电影票房预测 的相关搜索

关键词

探索5K巅峰，云梯架设的飞天之梦经验

明略数据吴明辉：人工智能的核心一定是大数据经验

大数据中心建设方案文档

利用深度学习进行时序数据的异常检测经验

飞天5K实战经验：大规模分布式系统运维实践经验

推荐系统老司机的十条经验经验

Kafka剖析（一）：Kafka背景及架构介绍经验

Kafka剖析(一):高扩展、高吞吐的分布式消息系统初探经验

微博技术大V老师木：软件平台是深度学习计算力突破的关键经验

NoSQL数据库的四大家族经验

hbase-总结文档

【Spark 1.5.1】安装经验

面向开发人员的机器学习指南经验

NoSQL 大数据时代的机遇和挑战文档

海量文件的分布式计算处理方案博客

HBase技术研究与应用分析文档

CentOS scribe+hdfs安装文档

HDFS+MapReduce+Hive十分钟快速入门文档

Storm0.9.5 安装笔记文档

hadoop 电影票房预测的相关搜索