Apache Spark 1.4.1 发布,开源集群计算系统 资讯

data sources 更多内容请看 发行说明 。 Apache Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在

jopen 2015-07-18   20371   0

Apache Spark 1.6 正式发布,性能大幅度提升 资讯

JSON data 更多改进内容请看 发行说明 。 Apache Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在

jopen 2016-01-04   18184   0
P15

  HBase 简介与实践分享 文档

HBase Features(Cont.)和Hadoop无缝集成 Hadoop分析后的结果可直接写入HBase; 存放在HBase的数据可直接通过Hadoop来进行分析。 11. HBase能用于Online场景吗?Why

zhpboy 2013-10-12   2979   0

Nginx + Tomcat + Openssl 配置https的web服务 经验

rded-proto" /> 四:配置Nginx 在http里面加入

jopen 2015-07-08   26349   0

Google开源C/C++版MapReduce框架 资讯

MapReduce for C(MR4C) 开源,此举可给Hadoop社区带来福音,因为这样用户就可以在自己的Hadoop环境中运行原生的C及C++代码了。 Hadoop是许多大数据应用的基础,它是由Apache

jopen 2015-02-24   25467   0

NoSql --之Hbase库 博客

转载: HBase是Apache Hadoop中的一个子项目,Hbase依托于Hadoop的HDFS作为最基本存储基础单元,通过使用hadoop的DFS工具就可以看到这些这些数据 存储文件夹的结构

chyx413332087 2013-01-30   763   0

【原创译文】21个数据科学的面试问题和答案(1-5) 资讯

。 Q3.如何验证一个用多元回归生成的对定量结果变量的预测模型。 回答者: Matthew Mayo . 模型验证方法: 如果模型预测的值远远超出响应变量范围,这将立即显示较差的估计或模型不准确。

jopen 2016-02-29   18028   0

使用Python训练SVM模型识别手写体数字 经验

支持向量机SVM(Support Vector Machine)是有监督的分类预测模型,本篇文章使用机器学习库scikit-learn中的手写数字数据集介绍使用Python对SVM模型进行训练并对手写数字进行识别的过程。

2457409219 2016-09-06   31878   0

新一代视频压缩技术 H.265 解析 资讯

.264采用DCT变换编码加D PCM差分编码的混合编码结构,还增加了如多模式运动估计、帧内预测、多帧预测、基于内容的变长编码、4×4二维整数变换等新的编码方式,提高了编码效 率。NAL则负责使用下层

jopen 2013-12-27   23949   0
H.265  
P45

  云计算探索与应用 文档

主线内核的虚拟化技术。 35. Hadoop HDFS ->GFS分布式文件系统 35 36. Hadoop HDFS ->GFS分布式文件系统(read) 36 37. Hadoop HDFS ->GFS分布式文件系统(write) 37

koujianbocuit 2012-06-12   673   0

2015 Bossie评选:最佳开源大数据工具 资讯

,允许你在处理大规模数据集时,打破本地机器上内存容量的限制。你可以在EC2上运行H2O,或者 Hadoop集群/YARN集群,或者Docker容器。用苏打水(Spark+ H2O)你可以访问在集群上并行的访问Spark

jopen 2015-10-21   51330   0

MapReduce实例浅析 经验

》中,详细剖析了MapReduce的原理,这篇文章则通过实例重点剖析MapReduce 1.MapReduce概述 Hadoop Map/Reduce是一个使用简易的软件框架,基于它写出来的应用程序能够运行在由上千个商用机

jopen 2014-12-19   17044   0

初学者指南:神经网络在自然语言处理中的应用 经验

 前馈神经网络; 5. 词嵌入; 6. 神经网络训练; 7. 串联和多任务学习; 8. 结构化输出预测; 9. 卷积层; 10. 循环神经网络; 11. 具体的 RNN 结构; 12. 模型树。

louja 2017-09-17   44011   0

情感分析的新方法——基于Word2Vec/Doc2Vec/Python 经验

words”可以被编码为 [2, 2, 1]。这些数据可以被应用到机器学习分类算法中(比如罗吉斯回归或者支持向量机),从而预测未知数据的情感状况。需要注意的是,这种有监督学习的方法要求 利用已知情感状况的数据作为训练集。虽然

jopen 2015-10-08   339563   0

神经网络研究新进展:可将平面图像转制为高精度3D模型 资讯

重建需要用到卷积神经网络(简称 CNN)来预测任意给定对象在三维空间中的形状,因此需要通过 CAD 模型对神经网络进行训练。 神经网络可以学习各种类型的对象,但由于预测量方面的局限性,其通常输出得相当粗

jopen 2017-08-24   24722   0
P24

  ZooKeeper 简介 文档

1)单机模式   首先,从Apache官方网站下载一个ZooKeeper 的最近稳定版本。 http://hadoop.apache.org/zookeeper/releases.html   作为国内用户来说,

forward51 2012-11-13   716   0
P27

  ZooKeeper 系列讲座_很全面 文档

1)单机模式   首先,从Apache官方网站下载一个ZooKeeper 的最近稳定版本。 http://hadoop.apache.org/zookeeper/releases.html   作为国内用户来说,

dedw 2016-01-05   354   0
P31

  第三章:MapReduce 分布式计算系统 文档

函数在其他语言中也是存在的,并不是Hadoop的专利。 Hadoop中的Map和Reduce 在Hadoop中,map函数位于内置类org.apache.hadoop.mapreduce.Mapper

beat_it 2013-11-16   1837   0

消息系统Kafka介绍 经验

消(队列)系统能够很好的处理实时或 者近似实时的应用,但未处理的数据通常不会写到磁盘上,这对于Hadoop之类(一小时或者一天只处理一部分数据)的离线应用而言,可能存在问题。 Kafka正是为了解决以

jopen 2014-01-22   25331   0

HadoopDB:混合分布式系统 经验

HadoopDB是一个Mapreduce和传统关系型数据库的结合方案,以充分利用RDBMS的性能和Hadoop的容错、分布特性。2009年被Yale大学教授Abadi提出,继而商业化为 Hadapt ,据称从VC那儿拉到了10M刀投资。

jopen 2013-05-19   13018   0
1 2 3 4 5 6 7 8 9 10