开源项目,开源代码,开源文档,开源新闻,开源社区

ML 和 SQL 的大量提升。 Spark是一个基于内存计算的开源的集群计算系统，目的是让数据分析更加快速。Spark非常小巧玲珑，由加州伯克利大学AMP实验室的Matei为主的小团队所开发。使用

f663x 2015-03-13 27556 0

Apache Spark

P27

需从浩瀚的日志中挖掘和分析数据问题数据量太大，机器不多搞不定。配置好的服务器很贵，只能选择使用每TB成本低的机器。机器多了， “毛病”花样百出。如果简便地进行系统扩展…… 有无合适的 分布式系统 4. 他山之石Google

cablist 2012-11-12 13153 0

Hadoop 分布式/云计算/大数据报告 Apache Go

访问、存储和处理来自不同数据源的多种数据需要不同的方法。每种模式都用于满足特定的需求：例如，可视化、历史数据分析、社交媒体数据和非结构化数据的存储。可以将多种原子模式结合使用，组成一个复合模式。这些原子模式没

jopen 2015-02-01 27853 0

大数据分布式/云计算/大数据

P3

经费管理，中期检查和项目结题。 l 项目调研内容无二、开发方案 l 进度安排期数预计完成时间完成内容软件报价(元) 首期 2011-12-1 调研内容于客户需求 l 软件开发进度安排开发周期(天)

TTX_ZCY 2014-04-12 6716 0

方案

一个运行在YARN上支持SQL的分布式数据仓库 Hive http://hive.apache.org/ 基于Hadoop MapReduce的SQL查询引擎流式计算 Facebook Puma 实时数据流分析 Twitter Rainbird

dgy7 2015-05-21 56121 0

开源分布式/云计算/大数据

自己是“大数据”公司，成熟的巨头企业会成立专门做大数据项目的数字创新团队。面对先进的计算数据收集和分析能力，许多初创公司和大型企业不惜以牺牲人的洞察为代价，过度地专注于收集定量数据。这种把定量数字凌驾

jopen 2015-05-31 25897 0

大数据

P35

信息化总体规划 xx集团 3个月内第二阶段 (部分并行) 业务流程重组及设计（业务调研、需求分析、管理诊断，专项管理模式设计、业务流程优化设计、IT解决方案设计） xx总公司5个月内第三阶段

sjava 2013-12-19 19871 0

项目管理方案报告培训

P11

3）想：交互是思考的输出产物和表现形式。当设计师将之前听到的和看到的内容在头脑中加以整理、分析，经过发散的创造性碰撞和严谨的逻辑论证后，逐渐得到了相对靠谱的交互产物。这个思索分析的过程贯穿于交互设计工作流程的每个环节。 4）说：一个能

sweetbaybe 2011-10-31 4013 0

作者简介：刈刀（程君杰），曾就职于阿里巴巴移动事业部，数据技术专家。主要负责业务数据分析挖掘系统架构和设计，包括大规模数据采集、分析处理、数据挖掘、数据可视化、高性能数据服务等。】 1.简介最近同事在总

MicahGustaf 2016-08-29 30736 0

Web服务器移动开发

P51

技术水平与实际能力 25 设计合理、理论分析与计算正确，实验数据准确，有很强的实际动手能力、经济分析能力和计算机应用能力，文献查阅能力强、引用合理、调查调研非常合理、可信设计合理、理论分析与计算正确，实验数据比较准

风之梦娜 2013-04-15 677 0

Android开发移动开发

议/ 分布式存储系统通常采用多副本的方式来保证系统的可靠性，而多副本之间如何保证数据的一致性就是系统的核心。ceph号称统一存储，其核心RADOS既支持多副本，也支持纠删码。本文主要分析ceph的多副本一致性协议。

MelanieStoc 2016-02-19 12299 0

Ceph 分布式/云计算/大数据

容器在共享操作系统上独立运行应用程序，这不需要 VM 来实现可移植性或管理一致性。与 VM 相比，容器提供低开销和快速配置能力，适合分布式应用程序的托管环境需求。 2、unikernel 可以与容器共存吗？容器不仅仅是 VM 的替代品，它也是与

五嘎子 2018-12-29 11046 0

"IveelySE.Grammar\IveelySE.Grammar.csproj", 是搜索引擎中的语法分析部分，例如：site、filetype等等。 "IveelySE.Index", "IveelySE

openkk 2012-08-05 65697 0

搜索引擎

可以像操作本地集合对象一样轻松地操作分布式数据集。尽管创建 Spark 是为了支持分布式数据集上的迭代作业，但是实际上它是对 Hadoop 的补充，可以在 Hadoo 文件系统中并行运行。通过名为 Mesos

jopen 2016-03-11 27731 0

址，在web服务器端，url地址对应web服务器上的文件系统中的某个网站文件的路径。Web server的作用就是解析HTTP协议，通过用户发来请求的url地址从web服务器的文件系统中找到用户需要的HTML页面、静态文件，然后返回给用

jopen 2011-10-27 32760 7

缓存网站架构 C/C++ PHP Go

很多分析认为，Linux正在成为一个更强大足以代替Windows的操作系统，最关键的原因在于，微软近几年的桌面操作系统新版本并没有获得认可。Windows 8就是一个活生生的例子，微软应该在功能、易

n6xb 2015-04-06 3650 1

Linux

finispan 与 GemFire。 3. 图数据库从推荐引擎到社交网络和地理分析，再到生物分析，图数据库都带来了极大的便利性。对于传统的 RDBMS 来说，朋友的朋友这种查询是非常低效的

jopen 2014-01-14 7699 0

技术

幸运的是，GitLab 提供了一个稳定的设置，即使实在一个没有特别措施的服务器上也能应用. 而由于分布式的天然特性，即使GitLab不能使用，git使用者也仍然能够提交代码. 不过，GitLab的一些特

jopen 2014-12-15 37928 0

GitLab Git 版本控制系统

，可以帮助企业安装，配置，运行hadoop以达到大规模企业数据的处理和分析。 Marp是一个比现有Hadoop分布式文件系统还要快三倍的产品，并且也是开源的。Mapr配备了快照，并号称不会出现SP

jopen 2015-01-05 7882 0

开源

生成器现在可以处理超过 21 亿的“尾节点”，同时可构建一个最小的 FST 节点更容易的压缩标准分析器现在有一个 tokenStream (String fieldName, String text)方法，因此不再需要使用

jopen 2013-07-24 9686 0

Solr Apache Lucene

Apache Spark 1.3 发布，基于内存计算的开源的集群计算系统资讯

Hadoop HDFS 实现原理与应用介绍文档

大数据架构和模式（四） - 了解用于大数据解决方案的原子模式和复合模式经验

软件开发方案书文档

开源大数据利器汇总经验

大数据离不开“厚数据” 资讯

IT项目实施方案模板文档

阿里巴巴公司内部资料：交互设计全档案文档

移动应用要如何埋点上传才能收集更多数据？经验

嵌入式课程设计之Android聊天室文档

ceph基于pglog的一致性协议经验

想清楚这 10 点再部署 Kubernetes 也不迟经验

C#实现的搜索引擎 - Iveely Search Engine 经验

Apache Spark 1.6.1 发布，集群计算环境资讯

大型网站后台架构的Web Server与缓存问答

Windows 与 Linux：微软没有理由担心被超越资讯

2014年值得关注的9项技术资讯

GitLab 的高可用性经验

2015 年有望 IPO 的 27 大科技公司，不乏开源资讯

Apache Lucene 4.4 和 Solr 4.4 发布资讯

MooseFS分布式文件系统调研分析的相关搜索

关键词

Apache Spark 1.3 发布，基于内存计算的开源的集群计算系统 资讯

Hadoop HDFS 实现原理与应用介绍 文档

大数据架构和模式（四） - 了解用于大数据解决方案的原子模式和复合模式 经验

软件开发方案书 文档

开源大数据利器汇总 经验

大数据离不开“厚数据” 资讯

IT项目实施方案模板 文档

阿里巴巴公司内部资料：交互设计全档案 文档

移动应用要如何埋点上传才能收集更多数据？ 经验

嵌入式课程设计之Android聊天室 文档

ceph基于pglog的一致性协议 经验

想清楚这 10 点再部署 Kubernetes 也不迟 经验