Netflix的开源文化与技术 资讯

挖掘。Netflix不仅使用 Hadoop、Hive、Pig、Parquet、Presto以及Spark等被广泛采用的开源技术,同时还开发并贡献了一些其他的工具和服务。 Genie :专为Hadoop

jopen 2015-11-24   31689   0
Netflix  

吃惊吗?原来这才是大数据的大问题! 资讯

L数据库和DataStax版本的Cassandra),以及处理流数据的技术(比如Apache Spark)。 与此同时,企业继续求助于更传统的数据基础设施,比如甲骨文数据基础设施。正如DB-Eng

jopen 2016-02-28   8148   0

深入了解推荐引擎组件(基于Apache Mahout和Elasticsearch) 经验

Mahout同时并行地运行多个MapReduce作业来计算物品的共同出现(Mahout 1.0运行在 Apache Spark之上)。Mahout的 ItemSimilarity作业用对数似然比检验(LLR)来确定哪些共同

jopen 2015-06-17   15837   0
P30

  浅谈容器集群管理-从Mesos到Kubernetes 文档

适用于多种框架和应用, 分布式系统内核, 构建一个巨大的静态的计算集群, 资源池, Hadoop、Kafka、Spark等众多framework作为数据处理插件 Kubernetes 专门针对容器集群, 轻量化、模块化、便携以及可扩展

dmc3 2015-07-26   633   0
虚拟化   方案   Apache   Nginx   Go  
P24

  hbase上搭建广告实时数据处理平台 文档

广告曝光和点击时查询hbase,做日志关联 优点: 大部分的查询能命中cache 9. 技术选型(5)为何不用: Impala Spark Cassandra 10. 技术方案 – 整体框架 11. 技术方案 – 整体框架每次广告请求分配唯一id

cpp45 2015-01-18   4816   0

张逸:我们推荐的高效工具 资讯

亚于坊间举行的技术大会,包含了敏捷组织转型、C++重构、敏捷测试体系、 持续交付整体解决方案、Spark 执行模型、机器学习、Scala 代码操练。课题五花八门,争辩激烈精彩。 临近尾声,洪敏提了

jopen 2015-01-05   7126   0
工具  

万亿级!腾讯大数据组件TubeMQ正式开源 资讯

括 Linux、KVM、MySQL、PostgreSQL、Kubernetes、Hadoop、Spark、TensorFlow 等等。以 KVM 为例,凭借向 KVM 贡献的 patch 数,腾讯云已经连续两年登上

五嘎子 2019-09-18   4703   0
TubeMQ  

4个理由告诉你Java为何排行第一 资讯

k,Scalesforce,eBay,当然还有Oracle。Hadoop,Cassandra和Spark,大数据工程的基础框架,无不使用Java或者Scala并且在JVM虚拟机上运行的。如果你想要良好

jopen 2016-02-19   24621   1
P4

  Flash Builder4 的快捷方式和调试技巧 文档

观。 选中一个Spark组件,点击其"外观"属性旁边的下拉按钮,并按下回车键,再选择"创建外观"将打开一个新建MXML外观的对话框(参见图2): 请注意,你可以创建一个默认的Spark外观的副本,然后

axuyin 2012-03-15   3229   0

揭秘TensorFlow:Google开源到底开的是什么? 资讯

而且从Jeff Dean的论文来看,它肯定是支持集群上的训练的。 在论文里的例子来看,这个架构有点像Spark或者Dryad等图计算模型。就像写Map-reduce代码一样,我们从高层的角度来定义我们的 业

jopen 2015-11-11   34562   0

28万个开源项目之番外篇 经验

Framework http://framework.zend.com/ Apache Spark http://spark.apache.org Flask http://flask.pocoo.org/

jopen 2015-06-03   53638   0

完整全面的Java资源库(包括构建、操作、代码分析、编译器、数据库、社区等等) 经验

件框架。 Apache Mahout :专注协同过滤、聚类和分类的可扩展算法。 Apache Spark :开源数据分析集群计算框架。 h2o :用作大数据统计的分析引擎。 Weka :用作数据挖掘的

encn 2015-05-20   142799   0

Hadoop中MapReduce框架入门 经验

谷歌它就用的C++实现, 而MapReduce编程模型(是高度抽象的)大体离不开下面这张图. Spark并行运算框架(和Hadoop的MapReduce)的不同点:在于它将中间结果即map函数结果直接放入内存中

jopen 2014-11-17   47213   0

使用mapreduce计算环比的实例 经验

最近做了一个小的mapreduce程序,主要目的是计算环比值最高的前5名,本来打算使用spark计算,可是本人目前spark还只是简单看了下,因此就先改用mapreduce计算了,今天和大家分享下这个例子,也算是对自己写的程序的总结了。

Smith 2016-02-21   16578   0

Flash与Flex路在何方? 资讯

。由于我们会提供未来发布版本的更详尽的信息,因此大家将会看到我们的承诺来解决很多领域的问题,如Spark组件的实现、可访问性、构建系统集成、性能分析工具以及下一代编译器的集成,这些举措会保证Flex成为企业级RIA应用的首选。

码头工人 2011-09-15   15271   1
Flash   Flex  

SQL 靠边站、GQL 来了:已成为 ISO/IEC 国际标准数据库语言项目 资讯

openCypher Morpheus 的基础上(后者将 Cypher 引入到 Apache Spark),并结合来自 LDBC 的G-CORE 的灵感,为用户提供了一种组合图查询语言,支持所有那些功能。这将使

五嘎子 2019-09-20   1558   0
SQL   GQL  

国外程序员整理的Java资源大全 经验

件框架。 Apache Mahout :专注协同过滤、聚类和分类的可扩展算法。 Apache Spark :开源数据分析集群计算框架。 h2o :用作大数据统计的分析引擎。 Weka :用作数据挖掘的

my5g 2015-01-07   84238   0

云+微服务+新硬件:下一代大规模并行数据库架构风格 资讯

员使用,而是给业务人员用的,因此处理日常重复性任务有更好的解决方案,比如MapReduce和 Spark。最后一点,因为并行数据库需要在数据分布(计算Hash)和存储格式(比如列存、压缩、索引、页面统计信息等)方面进行较多的处理以便为查询

jopen 2015-07-16   30812   0
架构  

Apache Eagle:分布式实时 Hadoop 数据安全方案 资讯

了支持多元化需求,我们引入越来越多样的数据存储和分析方案,比如Hive、 MapReduec、Spark 和HBase等,随之带来的管理和监控的挑战越来越严峻,数据安全问题亦是其中最重要的之一。

bger 2015-10-28   30641   0
P10

  大数据平台技术框架选型分析 文档

Hortonworks主导开发,运行在YARN上的DAG计算框架 Presto Facebook开源 Shark Spark上的SQL执行引擎 Pig 基于Hadoop MapReduce的脚本语言 Cloudera Impala

guet_lee 2017-01-12   675   0
1 2 3 4 5 6 7 8 9 10