Commons FileUpLoad 两种上传方式解 经验

RuntimeException("请设置form表单的enctype属性"); } Streaming API //设置文件上传路径 String UploadFilePath = "d:/upload";

jopen 2013-07-13   66475   0

梁堰波:主流SQL on Hadoop框架选择 资讯

在昨日(7月23日)的CSDN Spark微信群中,明略数据梁堰波就主流的SQL on Hadoop框架进行了深入分析,在给出了选择建议后并与用户进行了40分钟的互动与交流。 在 “YARN还是Mesos讨论之后(圆桌讨论:

mf7x 2015-07-24   26619   0
Hadoop  

Shark简介、部署及编译小结 经验

Shark简介 Shark即Hive on Spark,本质上是 通过Hive的HQL解析,把HQL翻译成Spark上的RDD操作,然后通过Hive的metadata获取数据库里的表信息,实际HD

jopen 2013-09-25   56857   0
Shark  

Mercury:唯品会全链路应用监控系统解决方案详解(含 PPT) 经验

年的金融/保险互联网技术架构和团队管理经验,擅长以产品思维设计和构建系统。现专注于互联网基础架构,负责唯品会全链路监控/分析平台的开发,管理,推广和运维落地工作。对大数据体系,实时计算,微服务体系,消息系统有深入研究和实践。

x609726871 2016-08-09   121191   0
P8

  Hadoop集群测试方案及计划 v1.0 文档

可以流的形式访问(streaming access)文件系统中的数据。 1.1测试目的 通过用Hadoop的HDFS文件系统分布式的存储工程实际运作中产生的海量数据文件,记录及分析作业完成的时间,对H

lygkkk123 2012-08-21   570   0

Hazelcast发布开源流处理引擎Jet 经验

么吗? Luck:Jet的主要目标是让运算速度快的大数据成为应用程序基础设施的一部分。类似Spark和Hadoop这样的技术过多地干扰了应用程序开发人员架构和思考。我们希望Jet可以为开发人员提供

mqfg1062 2017-02-15   9694   0

十大与云计算息息相关的编程语言 资讯

绑起来,帮助进行大数据分析。 4. Clojure数学语言 Clojure不仅仅是一门数学语言,它既是一门通用语言,还是一门函数语言。另外说来也巧,Clojure在数据分析人员当中也大受欢迎。

jopen 2015-09-16   17358   0

许鹏:Standalone部署模式下临时文件的生成和清除 经验

概要 Spark运行过程中资源的申请和释放一直是源码分析时需要关注的重点,从资源种类上来说,有CPU、内存、网络、磁盘,其中前三者会在进程退出时由OS来负责释放。而占用的磁盘资源,如果Spark自身不

jopen 2015-03-11   11357   0

[Apache Kafka]Kafka集成 经验

http://www.cnblogs.com/w1991/p/5155202.html Storm集成Kafka Storm简介 少量数据的实时处理可以使用JMS(Java Messaging Serv

JoyceFKJ 2016-01-25   25575   0

影响数据检索效率的几个因素 经验

Elasticsearc 这样的数据存储。然后在存储之上有一个分布式的实时计算层,比如 Hive 或者 Spark SQL。用户用 Hive SQL 提交给计算层,计算层从存储里拉取出数据,进行计算之后返回给用户。这种大数据的玩法起初是因为

jopen 2015-06-09   35005   0

开发者必备:基于Linux生态的十大AI开源框架盘点 资讯

Fork/Join 机制来实现多线程。 H2O 是一个更关注企业用户的人工智能分析工具,它聚焦于为掌握大量数据的企业用户提供快速精准的预测分析模型,从海量数据中提取有助于商业决策的信息。 根据 H2O 官方的数据,目前已经有超过

jopen 2017-01-12   28012   0
Linux   AI  

开发者必备:基于Linux生态的十大AI开源框架盘点 资讯

Fork/Join 机制来实现多线程。 H2O 是一个更关注企业用户的人工智能分析工具,它聚焦于为掌握大量数据的企业用户提供快速精准的预测分析模型,从海量数据中提取有助于商业决策的信息。 根据 H2O 官方的数据,目前已经有超过

jopen 2017-01-12   33302   0
Linux   AI  

LinkedIn开源Dr. Elephant 资讯

宣布开源 Dr. Elephant,Dr. Elephant 能够很好地帮助用户理解、分析和优化 Hadoop 和 Spark 的工作流。LinkedIn 在去年第八届 Hadoop Summit 上第一次在社区呈现。

jopen 2016-04-18   7457   0

Meson:支持Netflix的机器学习工作流 经验

择的技术。 机器学习管道的强大面孔 Netflix当前几种生成机器学习管道的关键角色是Spark, MLlib, Python, R和Docker。 下面来了解下一个典型的视频推荐的机器学

数据专家必知必会的 7 款 Python 工具 资讯

灵活,可嵌入解释器加载到任意一个自有工程里 简单易用,用于并行计算的高性能工具 由数据分析总监,Galvanize 专家 Nir Kaldero 提供。 GraphLab Greate

pkdi 2015-07-19   36165   0
Python  

简单的实时大规模机器学习基础架构:Oryx 经验

无论从建模还是部署,Oryx都可以随需扩展,Owen认为这是Oryx与Hadoop的传统“甜蜜点”——探索性分析和运营性分析最大的不同。 Owen认为传统的在Hadoop上部署机器学习的技术——Apache Mahout已经走到尽头。

jopen 2014-03-01   24541   0

Docker结合OpenStack在思源的经验分享 经验

Sahara Sahara是OpenStack中 "大数据即服务"的项目,支持Hadoop、Spark、CDH 5.x等。通过Heat编排可以使用KVM或者Docker作为计算资源。我们测试使用了H

jopen 2016-01-06   51428   0

9个最佳的大数据处理编程语言 经验

看上去就变得越来越笨拙。数据处理不再无足轻重,并且对精密分析和强大又实时处理的需要变得前所未有的巨大。 那么,在巨大的数据集中进行筛选的最好工具是什么?通过和数据骇客的交流,我们知道了他们用于硬核数据分析最喜欢的语言和工具包。 R语言

9个最佳的大数据处理编程语言 经验

不再无足轻重,并且对精密分析和强大又实时处理的需要变得前所未有的巨大。 那么,在巨大的数据集中进行筛选的最好工具是什么?通过和数据骇客的交流,我们知道了他们用于硬核数据分析最喜欢的语言和工具包。 R语言

NoahBlanks 2017-07-26   29507   0
大数据   R语言   Python   Java   Kafka  

分布式机器学习平台比较 经验

以极快的速度向前发展,而且,最近我们已经看到了有很多机器学习平台正在建立起来。 这篇文章 调查分析了多个分布式机器学习平台所使用的设计方法,并提出了未来的研究方向。这是我与我的学生Kuo Zhang、Salem

zhongkouwei 2017-08-28   40348   0
1 2 3 4 5 6 7 8 9 10