Apache Pig 开源项目

Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复

码头工人 2019-01-17   1160   0

TalkingData大规模机器学习的应用 资讯

TalkingData诞生于2011年,目前提供应用统计分析、游戏运营分析、移动广告监测、移动数据DMP平台、移动行业数据分析和洞察,以 及企业级移动数据分析和挖掘的解决方案等产品和服务。随着各项业务快速发展

jopen 2015-06-19   39103   1

2014-2015年排名前10位的基于Java的Web框架 资讯

这篇文章对今年2014年前10名基于Java的Web框架进行了一个分析,值得你在今年年底或者明年(2015年)开始的下一个项目考虑使用的框架。数据分析基于以下来源: Job openings (as of today)

jopen 2014-11-17   279294   0
Java  

每一个Java程序员必须使用的 8 个最好的工具 资讯

Spark是一个微型的Java Web框架,它的灵感来自于Sinatra,它的目的是让你以最小的代价创建出一个Java Web应用。 Spark拥有简单而直接的方法。您可以使用Spark框架做一

jopen 2015-03-04   32552   0
工具  

数据科学家调查:受挫数据多样性,吐槽 Hadoop 资讯

价堪比NFL四分卫,而且,他们比昆仑山上的雪豹数量还少。 显然,数据科学家个个都是 十八般数据分析武艺 样 样精通的绝世高手,但他们近来也有烦心事。不久前,开源数据库SciDB开发商Paradig

jopen 2014-07-30   5848   0
Hadoop   Spark  

Android Retrofit 实现文字(参数)和多张图片一起上传 经验

content-type 设为 application/x-www-form-urlencoded form表单在streaming时是 "weibo=stay4it&wechat=stay4it&qq=104816053"

daben 2016-08-25   49740   0

7 个你应该知道的Java工具 资讯

Ruscio, Mike Heffner and Dan Stodin. 4. Takipi – 错误跟踪和分析 Takipi was built with a simple objective in mind:

jopen 2014-10-18   14303   0

一个SparkSQL作业的一生 资讯

业的一生/ Spark是时下很火的计算框架,由UC Berkeley AMP Lab研发,并由原班人马创建的Databricks负责商业化相关事务。而SparkSQL则是Spark之上搭建的SQL解决方案,主打交互查询场景。

jopen 2015-12-08   30888   0

浅谈大数据应用研究的3个V 经验

之外,是否能借助数据去分析和进一步改进方案? 绝大部分时候我们停留在 Information 和 Intelligence 层面,也就是我们常用的统计分析,关联挖掘,聚类分析,分类(回归)预测等。

xxxway 2016-02-03   26162   0

《京东技术解密》读书笔记:坚持技术十年如一日 经验

"项目:将数据同步到离线数据仓库; ②流式数据采集 " 汉江 "项目:基于Storm提供实时计算API; ③实时查询服务 " 三峡 "项目:基于Spark和PrestoDB解决海量数据下的即时查询; ④实时数据挖掘

jopen 2016-01-10   30257   0
京东  

使用Mesos和Marathon管理Docker集群 经验

99%可用性)。每个额外的9变得越来越难实现。 分布式系统通常是以静态分区,比如Akka/Play、 Spark/Hadoop、Storm和 Redis各自分区分组划分。静态分区带来的缺点是增加复杂性,随着机器数量增加,

jopen 2016-01-03   21454   0
Docker  

使用Mesos和Marathon管理Docker集群 经验

99%可用性)。每个额外的9变得越来越难实现。 分布式系统通常是以静态分区,比如Akka/Play、 Spark/Hadoop、Storm和 Redis各自分区分组划分。静态分区带来的缺点是增加复杂性,随着机器数量增加,

jopen 2016-01-05   22136   0
Docker  

HBase RowKey设计的那些事 经验

ZooKeeper 进行托管,用 HBase 自带的 ZooKeeper 就可以,假如要部署其他应用,比如 Spark 等可以单独部署一个 ZooKeeper 集群。好,废话不多说了,下面说说 RowKey 设计的事。

f627 2015-07-16   27874   0

高性能Web服务器 Cherokee 经验

服务器软件,在性能上,甚至比 Nginx 还略胜一筹。与 Apache、Lighttpd、Nginx 等其他同类软件的对比,大家不妨看看这个 测试页面 。其易用性做得也很不错。 Cherokee 的功能包括支持

jopen 2011-12-20   18452   0

高性能Web服务器:Cherokee 经验

服务器软件,在性能上,甚至比 Nginx 还略胜一筹。与 Apache、Lighttpd、Nginx 等其他同类软件的对比,大家不妨看看这个 测试页面 。其易用性做得也很不错。 Cherokee 的功能包括支持

jopen 2013-03-14   10988   0

让餐厅放心的云服务-雅座CRM技术解密 经验

00家餐饮门店提供精准营销服务,而基于用户交易和消 费行为的数据分析是精准营销的核心,如何快速处理海量数据,进行多维度、低延时的统计分析、数据挖掘,对系统性能和可伸缩性提出了更高的挑战。本文来自雅 座CTO对其CRM技术的解密分享。

jopen 2015-07-03   78266   0
CRM   ERP/CRM  

CCF大数据专家委员会:2016年大数据发展趋势预测解读与行动建议 资讯

者也能够更好地理解大数据及其分析的效果和价值,从而可以从国计、民生两方面都充分发挥大数据的价值。 可视化是通过把复杂的数据转化为可以交互的图形,帮助用户更好地理解分析数据对象,发现、洞察其内在规律

jopen 2016-02-17   37372   0

2018年,20大Python数据科学库都做了哪些更新? 经验

Pandas(提交:17144,贡献者:1165) Pandas是一个Python库,提供了高级的数据结构和各种分析工具。该库的一大特色是能够将相当复杂的数据操作转换为一两个命令。Pandas提供了很多内置的方法,

user_zhou 2018-07-25   23584   0

盘点2014:十家最酷的大数据创业公司 资讯

今,商业和消费者正在产生 TB 乃至 PB 级数据,大量公司也加大了研发,致力于收集、存储、管理、分析数据。 以下是 2014 年大数据领域格外瞩目的十家新兴大数据创业公司 1. Aerospike

jopen 2014-12-25   21239   0

大数据基础架构总结 经验

和谷歌那套系统类似,Hadoop的最核心的存储层叫做HDFS,全称是Hadoop文件存储系统,有了存储系统还要有分析系统,于是就有了开源版本的 MapReduce,类似的参照BigTable就有了Hbase。一开源

jopen 2015-01-28   48655   0
1 2 3 4 5 6 7 8 9 10