开源项目,开源代码,开源文档,开源新闻,开源社区

马克斯·沃瑟曼（Max Wasserman）和我）就发表了这样一项研究。结合互联网上的众包数据，利用数据挖掘、复杂网络分析等手段，我们找出了比网友打分和专家评论更能反映电影作品重要性的指标。这项成果已于

jopen 2015-01-26 5126 0

机器学习

Pivotal 公司将把旗下大数据套件中的主要组成部分加以开源，而这正是从 Linux 发展概念中汲取到的灵感。此次决策将把 HAWQ、Greenplum 数据库以及 Pivotal GemFire

码头工人 2015-02-26 5986 0

Linux

91aea4cc722371d58aae3d22e94d2a4165276905 SQLite是遵守ACID的关联式数据库管理系统，它包含在一个相对小的C库中。它是 D.RichardHipp 建立的公有领域项目。

jopen 2015-01-17 12783 0

SQLite

今天要讨论一个传统的问题，问题本身比较简单，就是针对大数据，如何优化方案做到性能与成本的平衡。我们经常会遇到一种Key-list类型数据，如一个用户的好友关系 {“uid”:{1,2,3,4,5}}

jopen 2014-12-15 9596 0

大数据

1、做设计为什么还需要看数据？很多设计师从来不看数据，要么是因为没有数据可看，要么是根本不想看，但是也一样把设计做的很好啊！设计本来就是有感性的一面，为什么非得要和数据扯上关系呢？我们不妨先看

jopen 2015-01-06 10807 0

设计

always better than better algorithms? 在机器学习中，更多的数据总是比更好的算法好吗?对于 Quora 上的这个问题，Netflix 公司工程总监 Xavier Amatriain

jopen 2015-06-18 10169 0

机器学习

将大家引入歧途。大数据分析目前已经成为技术业界的主流趋势，每一家企业都开始将此类方案视为实现自身差异化优势的核心甚至是求得生存的关键所在。有鉴于此，关于大数据的各种误解也开始不断涌现。这些

jopen 2015-06-23 11979 0

Hadoop

Bigtable in the Cloud Google 为用户提供 Bigtable 云数据库 ——他们的自有数据库，在其搜索、Gmail、地图或 YouTube 等服务中使用已超过十年时间。Bigtable

ygw3 2015-05-08 6265 0

Bigtable

无论是体积还是价值，数据都在不断增长。快速而可靠地备份和恢复数据正变得越来越重要。社会已经适应了技术的广泛使用，并懂得了如何依靠电脑和移动设备，但很少有人能够面对丢失重要数据的现实。在遭受数据损失的公司中，30%

jopen 2015-07-27 8376 0

加密

竞赛问题的经历，为Spark等平台应用于数据科学领域提供了借鉴。 Danial提到，comSysto公司经常会举行一些讨论会，来评估未来的技术和共享以往的经验。在近期，大数据分析类的众包平台Kaggle的一道数据科学的挑战赛引

jopen 2015-11-19 17064 0

Spark

cn/JieJueFangAn/15497.html 背景大数据平台技术框架支持的开发语言多种多样，开发人员的背景差异也很大，这就产生出很多不同类型的程序(任务)运行在大数据平台之上，如：MapReduce、Hive、

jopen 2015-10-20 52068 0

大数据

原文 http://dockone.io/article/832 基于阿三的《Mesos大数据资源调度与大规模容器运行最佳实践》，主要就列举一些注意事项搭建采用的是在笔记本电脑上的virtu

jopen 2015-11-18 32507 0

Mesos

Kylin（麒麟）是由eBay贡献给开源社区的大数据分析引擎，支持在超大数据集上进行秒级别的SQL及OLAP查询，目前是Apache基金会的孵化项目[1]。本文是一系列介绍快速数据立方体计算（Fast Cubing

jopen 2015-09-10 25064 0

Apache Kylin

开源大规模并行处理（MPP）数据库Greenplum，其架构是针对大型分析型数据仓库和商业智能工作负载专门设计的。借助MPP这种高性能的系统架构，Greenplum可以将TB级的数据仓库负载分解，并使用所有的系统资源并行处理单个查询。

jopen 2015-11-03 11634 0

PostgreSQL

Windows 10令不少人感到很不爽的一点，就是对数据搜集的强制性，甚至根本不允许关闭。虽然官方一再保证，搜集的数据只是设备和系统相关，绝不涉及个人隐私，而且绝对安全，但是谁会放心呢？ Windows

jopen 2015-11-23 3736 0

Windows 10

则的和基于数据的。你也许想知道对话系统的基本原理是怎样的？特别是如何用数据驱动的方式构建一个对话系统？最近基于数据的自然语言对话技术取得了突破性的进展。我们发现，利用深度学习和大数据，可以很容易地构建一个单轮对话系统，

jopen 2015-12-04 36649 0

深度学习

功。该公司立足于大数据，与传统出租车公司相比，他们利用数据的方式更有效。这是他们能够取得成功的一个重要原因。Uber的整个商业模型就是以大数据众包原则为基础。他们有一个巨大的司机数据库，其中包含了他们

jopen 2016-01-11 4859 0

Uber 大数据

Phone的市场份额问题，来自Statista的最新数据，目前Android和iOS在移动市场上，已经占据了超过97%的份额。 2010年的时候，按照Statista的数据，iOS与Android两者共同的市

jopen 2016-03-03 4303 0

P18

Oracle数据库安全配置手册 Version 1.0 版本控制版本号日期参与人员更新说明 1.0 20131217 王峰目录第一章目的与范围 1 1.1 目的 1 1.2适用范围

mengdboy 2016-01-04 3216 0

Oracle 数据库服务器手册

P4

数据库的查询优化技术之二人们在使用SQL时往往会陷入一个误区，即太关注于所得的结果是否正确，而忽略了不同的实现方法之间可能存在的性能差异，这种性能差异在大型的或是复杂的数据库环境中（如联机事务处理

chicheng 2012-06-08 2122 0

哪些电影最经典？数据科学告诉你资讯

汲取Linux灵感，Pivotal开源大数据套件资讯

开源数据库，SQLite 3.8.8 发布资讯

大数据翻页的难点和技巧资讯

浅析数据化设计思维资讯

机器学习：更多的数据总是优于更好的算法吗？资讯

破解迷雾：关于大数据与Hadoop的九大误区资讯

Google发布云数据库Bigtable 资讯

6个备份数据的去重加密工具资讯

应用Spark解决Kaggle数据科学问题资讯

大数据平台任务调度与监控系统资讯

搭建MESOS大数据平台的总结资讯

Apache Kylin的快速数据立方体算法 - 概述资讯

Pivotal开源基于PostgreSQL的数据库Greenplum 资讯

Windows 10 数据搜集服务消失了？结果更狡猾资讯

基于大数据与深度学习的自然语言对话资讯

Uber令人惊讶的大数据使用方式资讯

数据显示 Windows Phone 再无力追赶 iOS 与 Android 资讯

Oracle数据库安全配置手册文档

数据库的查询优化技术之二文档

数据挖掘（的相关搜索

关键词

哪些电影最经典？数据科学告诉你 资讯

汲取Linux灵感，Pivotal开源大数据套件 资讯

开源数据库，SQLite 3.8.8 发布 资讯

大数据翻页的难点和技巧 资讯

浅析数据化设计思维 资讯

机器学习：更多的数据总是优于更好的算法吗？ 资讯

破解迷雾：关于大数据与Hadoop的九大误区 资讯

Google发布云数据库Bigtable 资讯

6个备份数据的去重加密工具 资讯

应用Spark解决Kaggle数据科学问题 资讯

大数据平台任务调度与监控系统 资讯

搭建MESOS大数据平台的总结 资讯

Apache Kylin的快速数据立方体算法 - 概述 资讯