开源项目,开源代码,开源文档,开源新闻,开源社区

万天猫、淘宝商家。目前，御膳房已经开放了商品、商家、客服绩效、品牌、行业五大主题数据，并提供了额外的数据仓库，其中有良好组织的各种数据供开发者来加工和使用。通过御膳房，专注数据的商家及相关服务商可以选择

jopen 2014-10-30 31624 0

大数据分布式/云计算/大数据

http://tajo.incubator.apache.org/ 一个运行在YARN上支持SQL的分布式数据仓库 Hive http://hive.apache.org/ 基于Hadoop MapReduce的SQL查询引擎

dgy7 2015-05-21 56121 0

开源分布式/云计算/大数据

动态的数据管理系统，所以在具有很多特性的同时，它也舍弃了一些功能，比如数据存储、处理数据的算法和元数据仓库。由于舍弃了这些功能，Calcite可以在应用和数据存储、数据处理引擎之间很好地扮演中介的角色。

jopen 2015-09-17 48869 0

分布式/云计算/大数据 Apache Calcite

Netflix推荐架构 Netflix推荐架构如图4所示图4 批处理层：从Hive、pig数据仓库，离线计算推荐模型，生成离线推荐结果实时处理层：从消息队列（Hermes、User Event

jopen 2015-11-24 31238 0

Lambda 软件架构

Ecto是一个Elixir的数据库ORM库 Ecto 的主要组成组件有四个： Ecto.Repo — Repository 是在数据仓库上的一层封装。通过 repository 我们可以创建、更新、销毁或者查询已有的数据。为了和数据库连接，一个

gogofyy 2016-02-23 38048 0

持久层框架

针对库的数据进行统计分析。所以之前做OLAP，需要很高级的硬件支持，大家都去IOE等买昂贵的服务器来做数据仓库以及进行数据分析。由于成本的问题，我们拿到的数据是很少的，所以进行统计分析和挖掘所得到的收益微乎其微。

MicahGustaf 2016-08-29 30736 0

Web服务器移动开发

等；需要做大量的数据采集和数据分析，但是预算有限的公司；诸如 Teradata 这样的能够推出新产品的数据仓库解决方案提供商。此外，像 EMC 这样的存储设备制造商也可以出售更多的磁盘驱动器，还有像 Cloudera

jopen 2012-05-08 8478 0

软件

P12

unlink等方式进行处理，建议用户在使用PHP建立文件的时候记得chmod文件权限，建议为777 问：如何使用文本文件作为数据仓库？有的留言本，论坛之类的都是使用这个的啊！答：其实这个主要还是使用了file，结合explode进行数据读取与分割的典型范例而已。

baixueshi 2012-05-15 3423 0

PHP开发 PHP

P10

索引一定能够加速查询 b.索引将会降低DML操作的速度 c.索引越多越好 d.bitmap索引不适合于数据仓库系统 14、下面那个命令是格式化用户进程跟踪文件的命令行工具： a. print b. transx

猫酷酷的 2013-04-18 2227 0

SQL

P5

要求较高的数据库系统，特别是online redolog文件，raid5适合大部分的数据库系统和数据仓库系统，读性能优于写性能。五：综合随意类 1:你最擅长的是oracle哪部分? 答:性能/sql

疯中静思 2012-06-04 403 0

Oracle 数据库服务器

P45

序。 2.传统的商业智能应用：针对特定问题的BI数据库会对产生高度优化的查询方式。对于此类应用，数据仓库可能是更合适的选择。 13. 13MongoDB操作安装 wget http://downloads

叶荣军 2012-08-22 4970 0

NoSQL数据库方案 C# C/C++ ErLang

P40

astException类型转换错误 34. SellerCube 系统规范数据存取方法持久化数据仓库 using SellerCube.Core; using ServiceStack.Redis;

wcmj1023 2013-12-16 585 0

NoSQL数据库 C# SQL Basic

P35

Kamber[坎伯]著范明…[等]译数据挖掘概念与技术机械工业出版社 2001 陈京民 . 数据仓库与数据挖掘技术[M] . 电子工业出版社,2002. (美) Mehmed Kantardzic著

likfefe 2016-01-15 2312 0

机器学习报告

P44

段：有共同结构的一个或几个区域( extent) d、tablespace 表空间：一组物理数据的逻辑组合，(象逻辑间数据仓库) e、 file 文件：属于某个表空间的物理文件 f、database 数据库：一组表空间所构

px520 2011-06-20 2603 0

Oracle 数据库服务器 SQL

这样可以保证数据行是按照顺序写入，对于SAS传统机械式硬盘写入性能更好，根据主键做关联查询的性能也会更好，并且还方便了数据仓库抽取数据。从性能的角度来说，使用UUID作为主键是个最不好的方法，它会使插入变得随机。 22、禁止使用分区表。

majijia505 2017-03-08 36628 0

MySQL DBA

se 和 Avro 已经于2010年5月成为顶级 Apache 项目[1]） * Hive：数据仓库工具，由Facebook贡献。 * Zookeeper：分布式锁设施，提供类似Google

fmms 2011-11-10 39842 2

Hadoop

里。那么这些结果被订阅者拿到后，就可以做进一步的实时处理，或实时监控，或放到 hadoop/离线数据仓库里处理。 3. 元信息监控作为操作记录的监控模块来使用，即汇集记录一些操作信息，可以理解为运维性质的数据监控吧。

jopen 2014-08-15 31250 0

Kafka

Database”的主旨演讲。而在今年的创业公司评选环节，获得头名的是一款名为Snowflake的SQL数据仓库。Snowflake是一款弹性数据云服务平台，能在一个系统内处理半结构化和结构化数据而不需要转换存储结构或者设置统一的操作模式。

n7w77 2015-03-19 20792 0

Hadoop

park on YARN。Spark可以与MapReduce运行于同集群中，共享存储资源与计算，数据仓库Shark实现上借用Hive，几乎与Hive完全兼容。 Spark 的核心概念 1、Resilient

jopen 2014-09-23 100810 0

Spark Hadoop 分布式/云计算/大数据

Apache Pig（一种强大的脚本语言）和 Apache Hive（一个具有类似 SQL 界面的数据仓库解决方案）。不幸的是，这个生态系统构建于一种编程模式之上，无法解决大数据中的所有问题。MapReduce

jopen 2014-10-09 24967 0

分布式/云计算/大数据 Hadoop YARN

御膳房：构建大数据的美食厨房经验

开源大数据利器汇总经验

Hadoop中新型大数据查询引擎：Apache Calcite 经验

Lambda架构与推荐在电商网站实践经验

Ecto是一个Elixir的数据库ORM库经验

移动应用要如何埋点上传才能收集更多数据？经验

5年内的暴风骤雨：12诱因统领软件行业大革命资讯

PHP 文件及目录操作总结文档

SQL考题文档

一份Oracle DBA 经典题目文档

MongoDB 技术交流文档

Redis NoSQL 系统文档

聚类分析 - PAM算法文档

ORACLE数据库入门文档

DBA的40条军规经验

Hadoop工程师成为热门职业资讯

分布式消息系统：Kafka 资讯

Strata+Hadoop World 2015见闻资讯

Spark与Hadoop的结合经验

Hadoop YARN的发展史与详细解析经验

数据仓库的相关搜索

关键词

御膳房：构建大数据的美食厨房 经验

开源大数据利器汇总 经验

Hadoop中新型大数据查询引擎：Apache Calcite 经验

Lambda架构与推荐在电商网站实践 经验

Ecto是一个Elixir的数据库ORM库 经验

移动应用要如何埋点上传才能收集更多数据？ 经验

5年内的暴风骤雨：12诱因统领软件行业大革命 资讯

PHP 文件及目录操作总结 文档

SQL考题 文档

一份Oracle DBA 经典题目 文档

MongoDB 技术交流 文档

Redis NoSQL 系统 文档

聚类分析 - PAM算法 文档

ORACLE数据库入门 文档

DBA的40条军规 经验

Hadoop工程师成为热门职业 资讯