开源项目,开源代码,开源文档,开源新闻,开源社区

P22

，不要轻易更改。 2. 公司Subversion配置说明公司的Subversion分为两个配置数据仓库：产品库：http://192.170.0.243/svn/product，存放各产品开发项目的配置库；

qyvip 2013-02-15 421 0

Subversion 版本控制系统手册

数仓管理：满足各类Hive表的DDL需求，同时支持UDF和文件上传建表；原始数据接入：支持日志抓取和MySQL数据接入数据仓库；非结构数据开发：支持作业托管，提供MR/Spark作业编译、管理、测试、部署一站式服务；数

juce7588 2017-04-11 36681 0

HDFS 集群/负载均衡

化服务消费者和服务提供者之间的策略通信。　　控制　　当企业着手于服务架构时，服务可以用来整合数据仓库（silos of data），应用程序，以及组件。整合应用意味着例如异步通信，并行处理，数据转

mike_libm 2014-01-01 2986 0

WEB服务/RPC/SOA

P22

空间1.76G ORACLE9i 9.0.2 空间2.86G 事务处理 -- 增删除修改频繁 数据仓库 -- 查询频繁 GBK --多200个字左右(偏僻字) GB2312 SETUP.exe 双击

deemoasia 2016-11-03 12827 0

Oracle 数据库服务器 Apache PHP C/C++

park on YARN。Spark可以与MapReduce运行于同集群中，共享存储资源与计算，数据仓库Shark实现上借用Hive，几乎与Hive完全兼容。 Spark 的核心概念 1、Resilient

jopen 2014-12-03 46280 0

Spark 分布式/云计算/大数据

平台的运营与研发。曾负责 Intel Hadoop 发行版的 Hive 及 HBase 版本研发。参与过百度用户行为数据仓库的建设和开发，以及淘宝数据魔方和淘宝指数的数据开发工作。给 Spark 社区贡献了 25+ 个 patch，接受的重要特性有

di742088 2016-05-19 68140 0

Spark 数据库分布式/云计算/大数据

5：Guardium 基础架构在 SonarG 架构中，收集器直接与 SonarG 大数据仓库进行通信，如图 6 所示。这种通信大大简化了数据收集机制，方便使用更少的硬件基础设施来更高效地收集更大的数据集。

ClaJEOK 2017-03-09 26533 0

Linux 大数据 SQL 分布式/云计算/大数据

P42

为满足中国移动提供互联网业务和服务的需要中国移动“大云”产品包括五部分：并行数据挖掘工具、分布式海量数据仓库、弹性计算系统、云存储系统和MapReduce并行计算执行环境。并行数据挖掘工具开发与应用试验云

iloveyepp 2012-11-07 1027 0

分布式/云计算/大数据方案 Go

P40

park on YARN。Spark可以与MapReduce运行于同集群中，共享存储资源与计算，数据仓库Shark实现上借用Hive，几乎与Hive完全兼容。从Hadoop 0.23把MapRedu

cador 2017-03-13 721 0

分布式/云计算/大数据方案 Apache Java Go

P50

持续的数据可用CDA使用案例使用数据复制来实现持续的数据可用数据可用和业务的持续工作负载和性能扩展跨站点集群异种数据传输实时数据仓库 升级和牵移的零停机时间 41. 数据库中间件架构设备需求数据库中间件控制器至少2台,保证数据库中件高可用

huafenged 2011-08-18 518 0

集群集群/负载均衡方案 HTTP Go

读取、处理和写数据。在LinkedIn也是大量使用。 Hive ：Facebook领导的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供完整的sql查询功能，可以将sql语句转换为

jopen 2015-03-09 47481 5

开源机器学习 JavaScript C/C++ Go

从各方面看，飞天 5K 都是阿里云乃至阿里巴巴历史上重要的里程碑。到今天，支付宝的所有数据处理、淘宝的数据仓库、阿里小贷的贷款业务等越来越多的集团关键应用，都已经由 ODPS 和飞天 5K 支撑。据刘振飞透

jopen 2014-10-10 30784 0

阿里云

P99

DBMS 基于 PostgreSQL 8.2 相同的客户端功能增加支持并行处理的技术增加支持数据仓库和BI的特性外部表(external tables)/并行加载(parallel loading)

f0xf0x 2013-11-21 3373 0

数据库服务器培训 HTTP Perl Python

* 传统的商业智能应用：针对特定问题的BI数据库会对产生高度优化的查询方式。对于此类应用，数据仓库可能是更合适的选择。 * 需要SQL的问题 Via: http://www.infoq.

jopen 2011-12-20 109494 0

MongoDB NoSQL数据库

的外部数据总会有失效的可能。 “写操作”同样可能失效不可信任的数据源同样也是一种不可信任的数据仓库。当你存储数据时，相似情况依旧可能会发生： 1）没有足够的安全权限 2）设备不存在 3）没有足够的空间

jopen 2015-01-29 21035 0

异常处理 .NET开发

化实现。这个定律也解释了一个有疑义的现象，也就是虽然经过数据获取、清理、融合等方式创建一个数据仓库，但是数据预处理仍然是必不可少的，仍然占有数据挖掘过程一半以上的工作量。此外，就像CRISP-

jopen 2015-01-28 28037 0

数据挖掘

量不算大，如果有10亿条数据，该怎么办呢？我们可以从硬件、分布式、数据预处理、数据切分、性能好的数据仓库等方面考虑。注：原始数据文件见360云盘链接：https://yunpan.cn/cu8BiNsvH66SD

jopen 2016-01-04 23337 0

算法 Java

源使用情况报表等等。提交的作业由作业调度中心进行调度；支持公共UDF类库。元数据管理提供对业务数据仓库元数据的共享支持。当前情况下，存在着很多客户机（任务提交机），用来提交作业。客户机必须经过平台管理方授权才可访问集群。

jopen 2015-09-22 38189 0

大数据软件架构

系统之间的交互媒介，数据是业务组件和共享数据库之间的交互媒介（参见《面向服务体系架构（SOA）和数据仓库（DW）的思考》所述共享库的概念），其中服务根据作用又可以进一步分成三小类：和人机交互相关的服务

jopen 2015-12-28 52023 0

Java EE SOAP 软件架构

这两种计算因子，使得用户在实现迭代式计算（比如：机器学习算法）时成本高且效率低。另一方面，在数据仓库的按天生产中，由于某些原始日志是半结构化或者非结构化数据，因此，对其进行清洗和转换操作时，需要结

樱桃大丸子 2016-04-09 55580 0

分布式/云计算/大数据 Spark

数据仓库的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

PHP Java MongoDB SQL Linux JavaScript Python 阿里云 C/C++ 数据挖掘大数据机器学习 SOAP Spark HDFS 软件架构版本控制系统 WEB服务/RPC/SOA .NET开发集群/负载均衡数据库服务器分布式/云计算/大数据 NoSQL数据库 Java EE 异常处理 Perl Subversion Apache Oracle 数据库

TortoiseSVN（Subversion）用户手册文档

HDFS Federation在美团点评的应用与改进经验

SOA面向服务的体系结构文档

oracle第一天文档

Spark：比Hadoop更强大的分布式数据计算项目经验

Spark的RDD原理以及2.0特性的介绍经验

通过 SonarG 释放 Guardium 数据的价值经验

运营商如何利用云计算技术服务客户和管理运营_v2 文档

spark--高效的分布式计算架构文档

Java计算池技术架构文档

那些年，追过的开源软件和技术问答

阿里云观察2014 资讯

Greenplum 数据库基础培训文档

MongoDB 系统介绍经验

.NET中异常处理的最佳实践（译）经验

数据挖掘之九大定律经验

轨迹压缩之Douglas-Peucker算法之Java实现经验

微店的大数据平台建设实践与探讨经验

面向服务体系架构的业务组件模型经验

Spark在美团的实践经验

数据仓库的相关搜索

关键词

TortoiseSVN（Subversion）用户手册 文档

HDFS Federation在美团点评的应用与改进 经验

SOA面向服务的体系结构 文档

oracle第一天 文档

Spark：比Hadoop更强大的分布式数据计算项目 经验

Spark的RDD原理以及2.0特性的介绍 经验

通过 SonarG 释放 Guardium 数据的价值 经验

运营商如何利用云计算技术服务客户和管理运营_v2 文档

spark--高效的分布式计算架构 文档

Java计算池技术架构 文档

那些年，追过的开源软件和技术 问答

阿里云观察2014 资讯

Greenplum 数据库基础培训 文档

MongoDB 系统介绍 经验

.NET中异常处理的最佳实践（译） 经验

数据挖掘之九大定律 经验

轨迹压缩之Douglas-Peucker算法之Java实现 经验

微店的大数据平台建设实践与探讨 经验

面向服务体系架构的业务组件模型 经验

Spark在美团的实践 经验

数据仓库 的相关搜索

关键词

TortoiseSVN（Subversion）用户手册文档

HDFS Federation在美团点评的应用与改进经验

SOA面向服务的体系结构文档

oracle第一天文档

Spark：比Hadoop更强大的分布式数据计算项目经验

Spark的RDD原理以及2.0特性的介绍经验

通过 SonarG 释放 Guardium 数据的价值经验

spark--高效的分布式计算架构文档

Java计算池技术架构文档

那些年，追过的开源软件和技术问答

Greenplum 数据库基础培训文档

MongoDB 系统介绍经验

.NET中异常处理的最佳实践（译）经验

数据挖掘之九大定律经验

轨迹压缩之Douglas-Peucker算法之Java实现经验

微店的大数据平台建设实践与探讨经验

面向服务体系架构的业务组件模型经验

Spark在美团的实践经验

数据仓库的相关搜索