Cloudera 发布实时查询开源项目 Impala (黑斑羚)!多款产品实测表明,比原来基于MapReduce的Hive SQL查询速度提升3~90倍。Impala是Google Dremel的模仿,但在SQL功能上青出于蓝胜于蓝。
一个属于你自己的关于推荐最近电影的app 电影爬虫采用python写的 地址 https://github.com/bravekingzhang/moveSpider 单线程而已,初步实现,后期打算做成多线程,加速爬取效率。
Hadoopy是Hadoop Streaming的一个Python封装,采用Cython开发。它简单,快速,并且易于被修改。它已经在超过700个节点的集群中测试过了。Hadoopy的目标是: Similar
Hadoop 作为一个较通用的海量数据处理平台,每次运算都会需要处理大量数据,我们会在 Hadoop 系统中对数据进行压缩处理来优化磁盘使用率,提高数据在磁盘和网络中的传输速度,从而提高系统处理数据的
LogFactory; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.filecache.DistributedCache;
要求按单词的首字母区分单词并分文件输出 代码如下: LineRecordWriter package com.hadoop.multi; import java.io.DataOutputStream; import
P27 1. 百度系统部HDFS实现原理与应用介绍lixiangna@baidu.com 2. 主要内容应用背景 Hadoop简介 HDFS设计目标 HDFS系统结构 HDFS实现原理 典型实例 3. 应用背景需求
这个“服务器推送技术”,希望,大家给点意见。
RecDB 是一个基于 PostgreSQL 9.2 构建的推荐引擎。运行应用开发者构建推荐应用,并提供很多广泛使用的推荐算法,例如用户-用户协作过滤、项目项目协作过滤、奇异值分解等。 使用 RecDB
item)的数据关系下很容易收集到一些偏好信息(preference),比如评分。利用这些分散的偏好信息,基于其背后可能存在的关联性,来为用户推荐物品的方法,便是 协同过滤 ,或称 协作型过滤 (collaborative filtering)。
声明一下,本文只是介绍一下最基础的基于内容的推荐系统(Content-based recommender system)的工作原理,其实基于内容的推荐系统也分三六九等Orz,这里只是简单的较少一下最原始的、最基本的工作流程。
mahout是机器学习的一个工具,里面封装了大量的机器学习的算法。 在Mahout实现的机器学习算法: 算法类 算法名 中文名 分类算法 Logistic Regression
recommendify 是基于 ruby/redis 的推荐引擎 (协同过滤)。 # Our similarity matrix, we calculate the similarity via co-concurrence
首先是封装了一个给予用户的推荐,用的相似度算法还是皮尔逊相似度,其他的也可以封装。 package com.liuxinquan.utils; import java.io.File; import
P42 分词系统研究完整版 ICTClAS分词系统是由中科院计算所的张华平、刘群所开发的一套获得广泛好评的分词系统,难能可贵的是该版的Free版开放了源代码,为我们很多初学者提供了宝贵的学习材料。
4月11日,美团大众点评正式宣布分拆猫眼电影业务,“新猫眼”成为了一家完全独立运营的公司。原美团点评平台事业群总裁郑志昊将接替因病休假的原猫眼CEO沈丽,成为新猫眼CEO。 此外,郑志昊继续兼任腾讯公司副总裁的职务。据
https://github.com/noyo/GridViewSelectPopWin 实现效果图 废话不多说,先上图片。 实现代码 MainActivity.java package com.practice
实现思路: 抓取一个电影网站中的所有电影的思路如下: 根据一个URL得到电影网站的所有分类 得到每个分类中的电影的页数 根据其电影分类的URL规律构造每个分类中每个页面的URL 分析每个页面中的html,并用正则把电影信息过滤出来
介绍: 一个基于RecyclerView实现的ViewPager,支持类似于gallary的fling操作 运行效果: 使用说明: 继承自 RecyclerView. 自定义 fling factor
而易举的事情,phpQuery让这成为了可能。 浅析phpQuery phpQuery 是基于php5新添加的DOMDocument。而DOMDocument则是专门用来处理html/xml。它提供了强大xpath选