Apache Spark 1.3 发布,基于内存计算的开源的集群计算系统 资讯

ML 和 SQL 的大量提升。 Spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速。Spark非常小巧玲珑,由加州伯克利大学AMP实验室的Matei为主的小团队所开发。使用

f663x 2015-03-13   27556   0
P27

  Hadoop HDFS 实现原理与应用介绍 文档

需从浩瀚的日志中挖掘和分析数据 问题 数据量太大,机器不多搞不定。 配置好的服务器很贵,只能选择使用每TB成本低的机器。 机器多了, “毛病”花样百出。 如果简便地进行系统扩展…… 有无合适的 分布式系统 4. 他山之石Google

cablist 2012-11-12   13153   0

大数据架构和模式(四) - 了解用于大数据解决方案的原子模式和复合模式 经验

访问、存储和处理来自不同数据源的多种数据需要不同的方法。每种模式都用于满足特定的需求:例如,可视化、历史数据分析、社交媒体数据和非结构化数据的存 储。可以将多种原子模式结合使用,组成一个复合模式。这些原子模式没

jopen 2015-02-01   27853   0
P3

  软件开发方案书 文档

经费管理,中期检查和项目结题。 l 项目调研内容 无 二、 开发方案 l 进度安排 期数 预计完成时间 完成内容 软件报价(元) 首期 2011-12-1 调研内容于客户需求 l 软件开发进度安排 开发周期(天)

TTX_ZCY 2014-04-12   6716   0
方案  

开源大数据利器汇总 经验

一个运行在YARN上支持SQL的分布式数据仓库 Hive http://hive.apache.org/ 基于Hadoop MapReduce的SQL查询引擎 流式计算 Facebook Puma 实时数据流分析 Twitter Rainbird

dgy7 2015-05-21   56121   0

大数据离不开“厚数据” 资讯

自己是“大数据”公司,成熟的巨头企业会成立专门做大数据项目的数字创新团队。面对先进的计算数据收集和分析能力,许多初创公司和大型企业不惜以牺牲人的洞察为代价,过度地专注于收集定量数据。这种把定量数字凌驾

jopen 2015-05-31   25897   0
P35

  IT项目实施方案模板 文档

信息化总体规划   xx集团 3个月内     第二阶段 (部分并行) 业务流程重组及设计(业务调研、需求分析、管理诊断,专项管理模式设计、业务流程优化设计、IT解决方案设计) xx总公司5个月内 第三阶段

sjava 2013-12-19   19871   0
P11

  阿里巴巴公司内部资料:交互设计全档案 文档

3)想:交互是思考的输出产物和表现形式。当设计师将之前听到的和看到的内容在头脑中加以整理、分析,经过发散的创造性碰撞和严谨的逻辑论证后,逐渐得到了相对靠谱的交互产物。这个思索分析的过程贯穿于交互设计工作流程的每个环节。 4)说:一个能

sweetbaybe 2011-10-31   4013   0

移动应用要如何埋点上传才能收集更多数据? 经验

作者简介:刈刀( 程君杰 ) , 曾就职于阿里巴巴移动事业部,数据技术专家。主要负责业务数据分析挖掘系统架构和设计,包括大规模数据采集、分析处理、数据挖掘、数据可视化、高性能数据服务等。】 1.简介 最近同事在总

MicahGustaf 2016-08-29   30736   0
P51

  嵌入式课程设计之Android聊天室 文档

技术水平与实际能力 25 设计合理、理论分析与计算正确,实验数据准确,有很强的实际动手能力、经济分析能力和计算机应用能力,文献查阅能力强、引用合理、调查调研非常合理、可信 设计合理、理论分析与计算正确,实验数据比较准

风之梦娜 2013-04-15   677   0

ceph基于pglog的一致性协议 经验

议/ 分布式存储系统通常采用多副本的方式来保证系统的可靠性,而多副本之间如何保证数据的一致性就是系统的核心。ceph号称统一存储,其核心RADOS既支持多副本,也支持纠删码。本文主要分析ceph的多副本一致性协议。

MelanieStoc 2016-02-19   12299   0

想清楚这 10 点再部署 Kubernetes 也不迟 经验

容器在共享操作系统上独立运行应用程序,这不需要 VM 来实现可移植性或管理一致性。与 VM 相比,容器提供低开销和快速配置能力,适合分布式应用程序的托管环境需求。 2、unikernel 可以与容器共存吗? 容器不仅仅是 VM 的替代品,它也是与

五嘎子 2018-12-29   11046   0

C#实现的搜索引擎 - Iveely Search Engine 经验

"IveelySE.Grammar\IveelySE.Grammar.csproj", 是搜索引擎中的语法分析部分,例如:site、filetype等等。 "IveelySE.Index", "IveelySE

openkk 2012-08-05   65697   0

Apache Spark 1.6.1 发布,集群计算环境 资讯

可以像操作本地集合对象一样轻松地操作分布式数据集。 尽 管创建 Spark 是为了支持分布式数据集上的迭代作业,但是实际上它是对 Hadoop 的补充,可以在 Hadoo 文件系统中并行运行。通过名为 Mesos

jopen 2016-03-11   27731   0

大型网站后台架构的Web Server与缓存 问答

址,在web服务器端,url地址对应web服务器上的文件系统中的某个网站文件的路径。Web server的作用就是解析HTTP协议,通过用户发来请求的url地址从web服务器的文件系统中找到用户需要的HTML页面、静态文件,然后返回给用

jopen 2011-10-27   32760   7
缓存   网站架构   C/C++   PHP   Go  

Windows 与 Linux:微软没有理由担心被超越 资讯

很多分析认为,Linux正在成为一个更强大足以代替Windows的操作系统,最关键的原因在于,微软近几年的桌面操作系统新版本并没有获得认 可。Windows 8就是一个活生生的例子,微软应该在功能、易

n6xb 2015-04-06   3650   1
Linux  

2014年值得关注的9项技术 资讯

finispan 与 GemFire。 3. 图数据库 从推荐引擎到社交网络和地理分析,再到生物分析,图数据库都带来了极大的便利性。对于传统的 RDBMS 来说,朋友的朋友这种查询是非常低效的

jopen 2014-01-14   7699   0
技术  

GitLab 的高可用性 经验

幸运的是,GitLab 提供了一个稳定的设置,即使实在一个没有特别措施的服务器上也能应用. 而由于分布式的天然特性,即使GitLab不能使用,git使用者也仍然能够提交代码. 不过,GitLab的一些特

jopen 2014-12-15   37928   0

2015 年有望 IPO 的 27 大科技公司,不乏开源 资讯

,可以帮助企业安装,配置,运行hadoop以达到大规模企业数据的处理和分析。 Marp是一个比现有Hadoop分布式文件系统还要快三倍的产品,并且也是开源的。Mapr配备了快照,并号称不会出现SP

jopen 2015-01-05   7882   0
开源  

Apache Lucene 4.4 和 Solr 4.4 发布 资讯

生成器现在可以处理超过 21 亿的“尾节点”,同时可构建一个最小的 FST 节点 更容易的压缩标准 分析器现在有一个 tokenStream (String fieldName, String text)方法,因此不再需要使用

jopen 2013-07-24   9686   0
1 2 3 4 5 6 7 8 9 10