基于Hadoop的实时查询:Cloudera Impala 经验

Cloudera 发布实时查询开源项目 Impala (黑斑羚)!多款产品实测表明,比原来基于MapReduce的Hive SQL查询速度提升3~90倍。Impala是Google Dremel的模仿,但在SQL功能上青出于蓝胜于蓝。

jopen 2012-10-24   35447   0

yours - 展示最近电影的app 经验

一个属于你自己的关于推荐最近电影的app 电影爬虫采用python写的 地址 https://github.com/bravekingzhang/moveSpider 单线程而已,初步实现,后期打算做成多线程,加速爬取效率。

jopen 2016-01-18   9944   0

Hadoopy: 使用Cython实现Python对Hadoop的封装 经验

Hadoopy是Hadoop Streaming的一个Python封装,采用Cython开发。它简单,快速,并且易于被修改。它已经在超过700个节点的集群中测试过了。Hadoopy的目标是: Similar

jopen 2013-01-11   24807   0

Hadoop 压缩实现分析 经验

Hadoop 作为一个较通用的海量数据处理平台,每次运算都会需要处理大量数据,我们会在 Hadoop 系统中对数据进行压缩处理来优化磁盘使用率,提高数据在磁盘和网络中的传输速度,从而提高系统处理数据的

hbnyb 2016-01-21   21499   0

Hadoop k-means 算法实现 博客

LogFactory; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.filecache.DistributedCache;

Hadoopp 2012-09-28   6420   0

Hadoop 实现多文件输出 经验

要求按单词的首字母区分单词并分文件输出 代码如下: LineRecordWriter package com.hadoop.multi; import java.io.DataOutputStream; import

jopen 2013-07-11   25859   0
P27

  Hadoop HDFS 实现原理与应用介绍 文档

1. 百度系统部HDFS实现原理与应用介绍lixiangna@baidu.com 2. 主要内容应用背景 Hadoop简介 HDFS设计目标 HDFS系统结构 HDFS实现原理 典型实例 3. 应用背景需求

cablist 2012-11-12   13153   0

基于Pushlet实现 问答

这个“服务器推送技术”,希望,大家给点意见。

qqzhijun 2011-10-17   13767   0

基于 PostgreSQL 的推荐引擎:RecDB 经验

RecDB 是一个基于 PostgreSQL 9.2 构建的推荐引擎。运行应用开发者构建推荐应用,并提供很多广泛使用的推荐算法,例如用户-用户协作过滤、项目项目协作过滤、奇异值分解等。 使用 RecDB

jopen 2013-11-20   21925   0

Python 基于协同过滤的推荐 经验

item)的数据关系下很容易收集到一些偏好信息(preference),比如评分。利用这些分散的偏好信息,基于其背后可能存在的关联性,来为用户推荐物品的方法,便是 协同过滤 ,或称 协作型过滤 (collaborative filtering)。

jopen 2014-06-29   83608   0

一个简单的基于内容的推荐算法 经验

声明一下,本文只是介绍一下最基础的基于内容的推荐系统(Content-based recommender system)的工作原理,其实基于内容的推荐系统也分三六九等Orz,这里只是简单的较少一下最原始的、最基本的工作流程。

jopen 2015-01-10   97525   0

mahout基于用户推荐的简单例子(1) 经验

mahout是机器学习的一个工具,里面封装了大量的机器学习的算法。 在Mahout实现的机器学习算法: 算法类 算法名 中文名 分类算法 Logistic Regression

jopen 2016-01-04   24094   0

基于 ruby/redis 的推荐引擎:recommendify 经验

recommendify 是基于 ruby/redis 的推荐引擎  (协同过滤)。 # Our similarity matrix, we calculate the similarity via co-concurrence

jopen 2014-02-09   21752   0

mahout基于用户推荐的简单例子(2) 经验

首先是封装了一个给予用户的推荐,用的相似度算法还是皮尔逊相似度,其他的也可以封装。 package com.liuxinquan.utils; import java.io.File; import

jopen 2016-01-04   7878   0
P42

  分词系统研究完整版(ICTClAS) 文档

分词系统研究完整版  ICTClAS分词系统是由中科院计算所的张华平、刘群所开发的一套获得广泛好评的分词系统,难能可贵的是该版的Free版开放了源代码,为我们很多初学者提供了宝贵的学习材料。      

wccy100 2015-09-28   1463   0

“独立”的猫眼电影,能打破传统电影发行渠道的信息垄断么? 资讯

4月11日,美团大众点评正式宣布分拆猫眼电影业务,“新猫眼”成为了一家完全独立运营的公司。原美团点评平台事业群总裁郑志昊将接替因病休假的原猫眼CEO沈丽,成为新猫眼CEO。 此外,郑志昊继续兼任腾讯公司副总裁的职务。据

jopen 2016-04-12   5057   0

Android实现类似网购电影票的简易GridView选择器 经验

https://github.com/noyo/GridViewSelectPopWin 实现效果图 废话不多说,先上图片。 实现代码 MainActivity.java package com.practice

jopen 2015-11-12   16939   0

用python实现一个抓取腾讯电影的爬虫 经验

实现思路: 抓取一个电影网站中的所有电影的思路如下: 根据一个URL得到电影网站的所有分类 得到每个分类中的电影的页数 根据其电影分类的URL规律构造每个分类中每个页面的URL 分析每个页面中的html,并用正则把电影信息过滤出来

jopen 2013-08-17   68753   0

RecyclerViewPager - 基于RecyclerView实现的ViewPager 经验

介绍: 一个基于RecyclerView实现的ViewPager,支持类似于gallary的fling操作 运行效果: 使用说明: 继承自 RecyclerView. 自定义 fling factor

jopen 2015-06-23   130889   0

基于jQuery的PHP实现:phpQuery 经验

而易举的事情,phpQuery让这成为了可能。 浅析phpQuery phpQuery 是基于php5新添加的DOMDocument。而DOMDocument则是专门用来处理html/xml。它提供了强大xpath选

jopen 2014-09-25   16745   0
1 2 3 4 5 6 7 8 9 10