Growth@Airbnb,从数据危机开始 资讯

题出在哪里?主页的改版业内人士和媒体都叫好,但是用户转化率骤减,为什么?要回答这些问题,脱离了数据分析都是纸上谈兵。好在到了 2012 年底,公司意识到了问题的严重性,下决心开始向数据驱动性的公司转型,而不再只是跟着感觉走。

jopen 2015-05-12   10568   0
数据  

源自Google、Facebook、Netflix和Cisco的10款开源安全工具很值得回味 资讯

Osquery 是属于 Facebook 开发的,同时,它也为很多企业提供了一个有力的专注于 SQL 系统的分析检测工具。 “利用 Osquery,你可以使用 SQL 查询系统底层的信息,”这个项目网站上描

jopen 2015-01-20   12238   0

Strata+Hadoop World 2015见闻 资讯

Patil的演讲中,他也向大家介绍了美国政府对于大数据的部分规划。 利用政府的庞大数据库,创造价值回馈于广大民众。比如利用数据分析,帮助医疗卫生系统工作,预测天气变化及灾害,管理交通预防拥堵等。 在政府内部推行大数据使用,从

n7w77 2015-03-19   20792   0
Hadoop  

Graphx:构建graph和聚合消息 经验

可以定位到local2global中查到具体的VertexId global2local是spark私有的Map数据结构GraphXPrimitiveKeyOpenHashMap, 保存verte

jopen 2015-01-13   41936   0
GraphX  

Hadoop即将过时了吗? 资讯

这个单词如今铺天盖地,几乎成了大数据的代名词。仅仅数年时间,Hadoop 从边缘技术迅速成长为一个事实标准。如今想玩转大数据,搞企业分析或者商业智能,没有 Hadoop 还真不行。但 Hadoop 狂热的背后却酝酿着一场技术变革, Hadoop

jopen 2012-07-11   31665   4
Hadoop  

MapReduce + Oracle = Tablefunctions 经验

duce范例一种映射来告诉大家在Oracle中构建存在,并且如何利用Oracle创建一个数据处理/分析管道...所以这里是一些我们在OpenWorld大会中正在使用的代码. 承上启下,首先我们讨论

jopen 2014-10-06   14418   0

GDC Online 2011预示十大移动领域发展趋势 资讯

大会所预示的十大移动领域发展趋势: 1. 谁将成为首个市值数十亿美元的手机社交游戏公司? 有 Storm8、Pocket Gems、TinyCo 和 Funzio 高管参加的讨论会无疑是目前手机社交领域最高端的讨论会。

jopen 2011-10-20   9534   0
移动  

大公司开源机器学习框架 资讯

股票交易/量化投资(知道你的高收益理财怎么来的吗?),手势识别(用过海豚浏览器的手势吗),还有医学分析等等,巨头们为了在未来占领先机,前仆后继的开源他们的机器学习框架,加速了人类进入智能时代的步伐(说什么,机器人?)

jopen 2015-12-31   38993   0

推荐系统老司机的十条经验 经验

挂钩。这个好理解,比如CTR预估当然关注的是点击这个隐式反馈。 举个例子,IMDB的电影排名,对比一下用票房排名和用评分排名,票房其实是一种隐式反馈的量化,表示“看过”,而评分则是显式反馈。

zljljy 2016-12-03   29681   0

开放式创新的崛起:打造可持续发展的开源软件公司 资讯

认可。 Apache Spark 以及大数据时代的来临 举个例子,如 Databricks 这家公司,其开发是完全的基于 Apache Spark 项目之上的,而 Spark 这个项目是2009年

jopen 2016-04-13   23499   0

研究机器学习之MLlib实践经验 经验

Dimensionality Reduction, Model Selection等。 目前最新的Spark 1.1.0版本中MLlib主要还是对核心算法的支持,辅助处理模块还很不完善。源代码包和其功能的对应关系如下:

jopen 2014-12-27   51748   0

每一个Java程序员应该知道的10个最好的Java工具 资讯

web application framework for java programmers. Spark focuses on being as simple and straight-forward

jopen 2015-01-15   23985   0

MemSQL 4.0.27 发布 资讯

MemSQL 今天发布 MemSQL 全新社区版本,免费,无限容量,无限规模,包括所有事物和分析功能! 由前 Facebook 工程师创办的 MemSQL,号称世界上最快的分布式关系型数据库,兼容

jopen 2015-05-20   5639   0
MemSQL  

从 0 到 1 打造直播 App 经验

可以明显看出视频网站、弹幕网站和直播平台更偏内容,他们对内容的需求更加高,用户在上面进行社交沉淀相对比较浅。 而后面三者更加偏向社交,他们强调人而不强调内容。所以短期内不会有大的竞争关系,只是前三类、后三者之间的竞争会出现。

kejt4875 2016-10-30   13898   0

Android 4.0通过新的特性统一了平板电脑与手机 资讯

用于转换图片与视频的新媒体效果可运行在GPU上:调整颜色级别与对比度、改变背景、锐化、剪裁、旋转、添加了光学变形等。 支持WebP、VP8、HTTP Live streaming v.3与Matroska容器。 连接。

fmms 2012-02-06   11717   0
P15

  服务器推送技术(Comet) 文档

请求,服务器阻塞回应等待下一次事件发生。 基于 Iframe 及 htmlfile 的流(streaming)方式 通过在 HTML 页面里嵌入一个隐蔵帧,然后将这个隐蔵帧的 SRC 属性设为对一个长

txdi2011bb 2013-04-03   5870   0
方案   HTTP   HTML   Java   JavaScript  

Docker将会改变Hadoop,变的更快更容易 资讯

本周,hadoop峰会召开,其中着重讨论了新平台(例如docker)将会如何在hadoop环境下改变大数据分析行业。 BlueData,一家大数据基础架构软件平台供应商,已经把对Docker contai

jopen 2015-06-22   29562   0
Docker  

大数据实时处理:百分点实时计算架构和算法 经验

应用接口供程序调取需要的各项数据,同时提供 了一些Web工具帮助业务人员对海量数据进行统计、汇总和分析。 在百分点大数据平台中,与实时计算密切相关的有实时计算框架和数据查询框架,这部分的组件架构和数据流如图 2所示。

jopen 2014-03-01   101750   0

Python实现的分布式计算框架:DPark 经验

DPark 是 Spark 的 Python 克隆,是一个Python实现的分布式计算框架,可以非常方便地实现大规模数据处理和迭代计算。 DPark 由豆瓣实现,目前豆瓣内部的绝大多数数据分析都使用DPark

jopen 2013-06-06   47199   0

大型网站架构系列:分布式消息队列(一) 经验

:做日志解析,统一成JSON输出给Elasticsearch。 (3)Elasticsearch :实时日志分析服务的核心技术,一个schemaless,实时的数据存储服务,通过index组织数据,兼具强大的搜索和统计功能。

免费教程 2016-03-30   22182   0
1 2 3 4 5 6 7 8 9 10