推升R成为支持企业端与云端跨平台分析的企业标准 资讯

On-Premises and in the Cloud 不到一年前,我们决定买下 R,最广为采用的统计运算与分析预测程序语言,在商用软件与服务领域的领导厂商 Revolution Analytics 公司 ( 请参考:

jopen 2016-02-18   23299   0
P20

  海量数据处理之大跃进 文档

,无需人工干预 5、任务失败晚上的告警方案 7. 遇到的问题随着产品指标的增多,需要维护大量的统计分析脚本。 任务计算量增多,调度系统支持性能下降 大量的计算任务失败,每天需大量的人力去维护计算。 随着数据结果的累积,Mysql扩展困难。

nd7b 2015-12-09   2250   0

Gearpump:基于 Akka 的大数据实时处理引擎 经验

Gearpump is a real-time big data streaming engine. It is inspired by recent advances in the Akka framework

jopen 2016-01-20   14766   0

反思 | 分布式框架是必须的吗? 经验

者批量处理任务,例如Hadoop和Storm,从而提高重用性。 当有人问起该如何处理大数据问题时,他们总是被指引到现存的产品中,例如Hadoop或者Storm。虽然这些产品非常棒,但也引发了一

jopen 2015-09-24   9007   0
P34

  从“被虐”到“落地” - 明略大数据产品演进实践 文档

目录WHY大数据落地被虐实例如何应对案例分享 8. 信心爆棚的进击Hadoop HBase Spark Storm Impala ML 9. 很快感受到森森的恶意 10. 丰富的数据源 11. 权力的游戏

w327 2015-05-25   473   0

实时推荐系统的3种方式 经验

类、推荐栏位、场景等不同,设计不同的模型。同时由于用户、SKU不停地增加,需要定期对数据进行重新 分析,对模型进行更新,但是定期对模型进行更新,无法保证推荐的实时性,一段时间后,由于模型训练也要相当时

jopen 2015-06-18   132273   0

一篇文看懂Hadoop:风雨十年,未来何去何从 资讯

中间层——资源及数据管理层,YARN以及Sentry等 上层——MapReduce、Impala、Spark等计算引擎 顶层——基于MapReduce、Spark等计算引擎的高级封装及工具,如Hive、Pig、Mahout等等 存储层

jopen 2016-03-10   25303   1
Hadoop  

大数据(三) - YARN 经验

单点故障 难以支持MR之外的计算 多计算框架各自为战,数据共享困难 MR:离线计算框架 Storm:实时计算框架 Spark:内存计算框架 YARN设计目标 通用的统一资源管理系统 同时运行长应用程序和短应用程序

jopen 2016-01-20   12303   0

大数据的明天将驶向何方? 经验

Matt Turck 的 文章 。本文全面总结了大数据领域的发展态势,分析认为尽管大数据作为一个术语似乎已经过气,但是大数据分析与应用才刚刚开始兴起,在与 AI、人工智能等新兴技术的结合下,大数据的机会也许要比大家想象的还要大。

XZSIsa 2016-04-12   47818   0

2016大数据版图 资讯

Matt Turck 的 文章 。本文全面总结了大数据领域的发展态势,分析认为尽管大数据作为一个术语似乎已经过气,但是大数据分析与应用才刚刚开始兴起,在与 AI、人工智能等新兴技术的结合下,大数据的机会也许要比大家想象的还要大。2016年

jopen 2016-02-03   39109   0

FEX 技术周刊 - 2015/11/23 资讯

2PzQrLrwQUkg9koO0dg/preview React 与 Angular 2 的对比。 React 源码剖析系列 - 不可思议的 react diff http://zhuanlan

jopen 2015-11-23   45645   0
FEX  

基于Mesos和Docker的分布式计算平台 经验

基于Mesos之上可以运行不同的 分布式计算平台,如SparkStorm、Hadoop、Marathon和Chronos等。SparkStorm和Hadoop这样的计算平台有 任务调度功能,可以直接使用Mesos

jopen 2015-06-09   29935   0

京东如何由“调用链”实现多维度的分布式跟踪? 经验

在内的日志信息,通过TraceId将散落在调用链中不同系统上的“孤立”日志联系在一起,然后通过日志分析,重组还原出更多有价值的信息。 3 CallGraph的特性及使用场景 CallGraph本质

ChrGuilfoyl 2017-02-07   24773   0

2016年,大数据还是回事么? 资讯

Turck,提下这一家 VC,主要投资于早期阶段技术类公司的风险投资机构,包括新兴媒体、广告、游戏、教育、云计算、分析和基础设备等方向。大家熟悉的 Airbnb,Pinterest,Shopify 都有它的投资身影。

jopen 2016-02-24   39098   0

机器学习框架,类库和软件汇总 经验

NLP operations (disambiguation, classification, streaming text filtering, etc...) as quickly and intuitively

jopen 2015-11-23   70827   0

事件流如何提高应用程序的扩展性、可靠性和可维护性 经验

选项(a)的好处是,存储原始事件数据可以最大化分析的灵活性。比如,可以跟踪某个人以什么顺序访问了哪些页面,采用选项(b)就无法实现。这种分析对于一些离线处理任务非常重要,比如训练一个推荐系统。在这种应用场景下,最好是保存原始事件。

jopen 2015-04-03   22838   0

Mesos 在爱奇艺的实践 经验

支撑着许多重要业务,包括但不限于,几乎所有视频、音频、图片转码,对服务质量和稳定性要求非常高的在线服务以及 StormSpark 这类实时计算分析业务等。 牛刀小试 时光如逝,回望 Mesos 在爱奇艺的发展历程,也并非

KurtBohn 2017-09-18   43354   0
Mesos   Docker   微服务   PaaS   IaaS  

搭建MESOS大数据平台的总结 资讯

注:书的编排估计有点问题,前面mesos安装部署时举例没有讲zookeeper配置方式,而后面的hadoop、sparkstorm等等举例又用的是zookeeper配置方式,所以这里要先做一下P108页的zookeeper配置。

jopen 2015-11-18   32507   0
Mesos  
P24

  hbase上搭建广告实时数据处理平台 文档

用户特征 http://e.qq.com 3. 背景:广告数据流 4. 背景实时storm+离线mapreduce计算,多维度分析 难点:如何把大量的信息从广告选取阶段传递至广告点击的模型训练? Proto

cpp45 2015-01-18   4816   0

60款顶级大数据开源工具 经验

说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hadoop。Market

jopen 2015-11-14   179651   0
1 2 3 4 5 6 7 8 9 10