Java资源大全中文版(Awesome最新版) 经验

官网 Apache Mahout :专注协同过滤、聚类和分类的可扩展算法。 官网 Apache Spark :开源数据分析集群计算框架。 官网 DeepDive :从非结构化数据建立结构化信息并集成到已有数据库的工具。

awzebr76hj 2016-09-18   10317   0

Java资源大全中文版 经验

件框架。 Apache Mahout :专注协同过滤、聚类和分类的可扩展算法。 Apache Spark :开源数据分析集群计算框架。 DeepDive :从非结构化数据建立结构化信息并集成到已有数据库的工具。

jopen 2015-11-03   117384   0

帮你提升 Python 的 27 种编程语言 资讯

Nvidia 的 CUDA 等类似的技术实现硬件级并发执行,也有助于研究如何使用 Apache Spark 和 Blaze 等数据处理框架实现分布式数据处理。 统计数据分析语言: R 由于有越来

jopen 2015-10-22   55791   0
Python  

分布式系统的特点以及设计理念 资讯

些分布式系统,使得Google可以处理高并发请求响应以及海量数据处理等。Apache旗下的Hadoop、Spark、Mesos等分布式系统,把大 数据处理相关技术变得非常亲民,让更多企业客户体会到了分布式系统的便利。

jopen 2015-06-13   13309   1

RebornDB:下一代分布式Key-Value数据库 资讯

关于译者: 付军,平安科技资深开发工程师,主要做数据处理及报表展示方面工作,关注Hive、Spark SQL等大数据处理技术。

jopen 2015-07-13   15231   0

2017谷歌云大会,一口气发布100+消息 资讯

笔记本上执行模型迭代、分析数据。 Cloud Dataproc updates :对于运行 Apache Spark、Flink、Hadoop 管道的管理服务提供了新的支持,支持创建轻量级部署的单节点集群,提供了

jopen 2017-03-15   37414   0
Google  

基于 Node.js 的声明式可监控爬虫网络 经验

也涉及到机器学习、大数据处理等多个领域的知识。我们可以使用 Hadoop MapReduce、Spark、Flink 等离线或者流式计算引擎来处理海量数据,使用词嵌入、主题模型、LSTM 等等机器学习技术来分析文本,可以使用

WerPicton 2017-04-19   21081   0

阿里云破纪录的背后:377秒是如何炼成的? 资讯

Benchmark 官方宣布,阿里云用377秒完成了100TB的数据排序,打破了此前Apache Spark创造的1406秒纪录。在含金量最高的 GraySort 和 MinuteSort 两个评测系统中

jopen 2015-11-04   9264   0

构建大型云计算平台分布式技术的实践 经验

所以我们建立起全链路的监控,收集所有的SQL日志、网络行为和用户行为,注入到一个Kafka集群,然后用JStorm和Spark做实时分析,ODPS做离线分析。目前每天的SQL日志语句的量级在几十个T,可以在秒级发现问题,比

jopen 2014-07-29   42020   0

那些好用的iOS开发工具 经验

com/square/PonyDebugger )、Reveal( http://revealapp.com/ )、Spark Inspector( http://sparkinspector.com/ )是三个常用的界面调试工具,可以在程序运行时动态调试

jopen 2015-12-29   33078   0

当当网 Docker 应用实践 经验

tes? A:因为Mesos比较成熟,Kubernetes也不好拉镜像,而且我们数据分析用Spark也是运行在Mesos上,比较熟悉,而且混合负载也比较好。 Q:容器网络用的是什么? A:是用它自己的Bridge。

ShellyBrode 2016-09-29   9436   0
Docker  

2016年你应该学习的语言和框架 经验

和 Flask 。用 Ruby 有Rails 和 Sinatra。用Java有 Play 和 Spark。用Node.js你可以选择 Express, Hapi 和 Sails.js ,还有 Go 语言的Revel。

jianzhao 2016-11-10   10411   0
CSS   数据库  

Hadoop十岁!Doug Cutting成长史+他眼中大数据技术的未来 资讯

许是最古老和最成功的组件,但是每年都会引入新的、改进的技术。新型的执行引擎(例如Apache Spark)和新型的存储系统(例如Apache Kudu(正在孵化中))表明,这种软件生态系统的发展非常迅

jopen 2016-02-15   25367   0

Java多线程编程模式实战指南(三):Two-phase Termination模式 经验

基于开源软件的Azure平台大规模系统构建 QCon北京2015 PHP开发组核心成员惠新宸 QCon北京2015讲师 Spark SQL开发者连城 相关赞助商 Windows Azure专区上线,全面了解云服务 精彩呈现

jopen 2015-01-22   24020   0

ElasticDL:首个基于 TensorFlow 实现弹性深度学习的开源系统 资讯

情况相应增减,所以作业必须是容错的,才能配合调度系统,实现弹性调度。 在这个过程中,容错通常由分布式框架实现,比如 Spark 和 ElasticDL 都可以做到当有进程挂掉,或者新的进程加入时,作业不会暂停或者重启,而是

五嘎子 2019-09-12   873   0

美国电信巨头Verizon基于Mesos和容器的实践经验 经验

来支持IoT服务,包括多媒体服务、视频流媒体服务等等。Verizon还计划将其 Hadoop和Spark分析任务从他们的专属集群上迁移到Mesos集群。 Verizon的具体容器技术选型 系统采用

jopen 2015-09-12   30335   0
Mesos   Docker  

基于Solr的淘宝商家交易数据实时查询方法 经验

经很难满足大数据时代对数据处理的需求。 ` 所以,在大数据时代使用hadoop,hive,spark,作为处理离线大数据的补充手段已经大行其道。以上提到的这些数据处理手段,只能离线数据处理方式,无

JasminUDKU 2016-02-02   41954   0

人工智能从入门到进阶,机器之心高分技术文章全集 经验

深度学习遇上基因组,诊断疾病和揭示深层生物原理或迎来突破 King+Woman-Man=Queen:用基于Spark的机器学习来捕捉词意 初学者必读:从迭代的五个层面理解机器学习 轻量级Matlab深度学习框架LightNet的实现

jackyyou 2017-01-31   15472   0

优步分布式追踪技术再度精进 经验

enTracing标准的语言,一个基于 React 的Web前端,以及一个基于 Apache Spark 的后处理和聚合数据管道。 统包式分布式追踪 Zipkin UI是我们在Jaeger中使用的

真的需要一个人人都会编程的未来么? 资讯

的 GUI 工具必须得提高,使得设计师设计 GUI 界面,随后程序员来接管界面与后台的交互( Spark Inspector 和 Reveal 预示未来)。 其它一些提供给非程序员类编程能力的有批处理器(如

jopen 2013-11-09   22198   0
编程  
1 2 3 4 5 6 7 8 9 10