50 家硅谷 IT 公司技术博客-吐槽篇 资讯

语音,图片,行为识别上都可圈可点。在大数据领域使用 NVIDIA GPU 多核集群,大胆采用 Spark Tachyon 做内存计算和存储。 7. Yahoo 作 为老牌互联网公司,虽然目

jopen 2016-03-05   44090   0
P35

  CarbonData Partition 功能介绍 文档

Mail:caolu@saicmotor.com 3. 上汽集团数据业务部主要负责 规划和实施数据管理体系 建设大数据基础架构和分析平台 拓展和提升集团内企业数据业务能力 推动人工智能技术在集团业务中的应用 为上汽集团战略转型和创新发展提供支持和服务。

五嘎子 2017-09-11   1391   0
Apache   SQL  

11个著名的开源机器学习工具 经验

Cloudera’s emphasis on analyzing live streaming data by way of the Spark project, Oryx is designed to allow

fd5f 2014-12-29   50116   0

利用Python进行Elasticsearch数据索引 经验

Elasticsearch 是一个分布式、Restful的搜索及分析服务器,和Apache Solr一样,它也是基于Lucence的索引服务器,而Elasticsearch对比Solr的优点在于: 轻量级:安装启动方便,下载文件之后一条命令就可以启动;

jopen 2015-12-24   53015   0

在开发中,如果编程语言(例如PHP)和SQL(例如MySQL)都能实现某个功能,我们是用编程语言实现还是SQL?还是具体问题具体分析 问答

目前见到的性能瓶颈最多的就是在数据库层,关系数据库的横向扩展虽然在发展,但是还没有被广泛接受的稳定方案,所以近几年 NoSQL 会有这么快的发展。而 application server 的横向扩展就成熟许多了,增加 application server 之后只需要在 web server 上的负载均衡列表里加上新的机器就好了。 既然数据库横向扩展比 application server 横

zzzluju 2012-07-05   8037   1
数据库   负载均衡   C/C++   Go   SQL  
P30

  程浩-SparkSQL漫谈 文档

1. Spark SQL 漫谈Cheng Hao Dec 13, 2014Copyright © 2014 Intel Corporation. 2. AgendaSpark SQL Overview

cdop 2014-12-29   2924   0

Paracel:豆瓣开发的大型分布式计算框架,用于机器学习、图算法 经验

Paracel和Spark/GraphLab的主要区别是什么? Spark 和GraphLab都是非常成功的分布式计算框架,它们各自有着很多吸引用户的优点,但也存在一些局限性。Spark提出了RDD的概念并赋予其一系列的

yne7 2015-03-30   17278   0

推荐系统资源列表(List of Recommender Systems) 经验

are: PredictionIO is built on technologies Apache Spark , Apache HBase and Spray . It is a machine learning

jopen 2015-06-18   18486   0

我在Mesos上运行Docker容器的经验 经验

我的技术栈 正如在此博客中我所写到的,我想和你分享我如何在一个单集群中使用Docker容器来运行分析作业。我们在Zions研究这个技术(当然,我也会在家运行它),该技术是在MapR平台和 MapR-FS

cebp 2015-07-13   18436   0
Docker  

Mesos在Qunar的应用 资讯

们的日志平台,将日志分析全部托管在了Mesos平台上。这个平台面向业务线开发/测试/运营人员,方便定位/追溯线上问题和运营报表。 这个是我们平台的结构概览。 日志分析我们使用ELK(Ela

jopen 2015-09-15   18302   0
Mesos  

2015年最受Scala开发者欢迎的类库前100名排行 资讯

Scala 类库的排行。整个工作耗时一月,下面是他出色的研究成果。 基于 64562 个类库的分析,Github 上 Scala 项目使用最多的类库到底有哪些呢? 在这篇文章中我们将进入 github

jopen 2015-07-27   20383   0
Scala  
P1

  hadoop面试小结 文档

 namenode: avoid single point of failure. 数据流系统:streaming storm(twitter). 演练算法: wordcount 字典同位词 翻译sql语句 select

wujiuliu 2013-05-31   7460   0

吕信:PrestoDB在京东的应用实践 资讯

有一个在大数据方面有一个战略调整,我们急需要构建我们的数据仓库。要求很简单,要求实时和准实时的数据分析和计算,经过我们调研,后来我们选到了PrestoDB。这中间的就要求很多,是我们的首席科学家与 H

jopen 2015-06-26   36048   0

用Apache Kafka构建流数据平台 资讯

ta 近来,有许多关于“流处理”和“事件数据”的讨论,它们往往都与像 Kafka 、 Storm 或 Samza 这样的技术相关。但并不是每个人都知道如何将这种技术引入他们自己的技术栈。于是,Confluent联合创始人Jay

jopen 2015-03-03   19614   0

Kafka知识点汇总 经验

1、 Kafka是一种分布式的,基于发布/订阅的消息系统。 2、 常用Message Queue对比 RabbitMQ RabbitMQ是使用Erlang编写的一个开源的消息队列,本身支持很多的协议:AMQP,XMPP

jopen 2016-01-10   14844   0

Coursera数据工程师董飞:硅谷大数据的过去与未来 资讯

;但技术成熟后,期望 又重新上升,重新积累用户,然后就到了可持续增长的健康轨道上来。今年和去年的图对比显示,物联网、自动驾驶汽车、消费级 3D 打印、自然语言问答等概念正在处于炒作的顶峰。而大数据已从顶峰滑落,NFC

jopen 2015-01-27   53601   0

面试经验分享之机器学习、大数据问题 经验

推荐、题目推荐、新闻推荐等; 排序,搜索结果排序、广告排序等; 广告投放效果分析; 互联网信用评价; 图像识别、理解。 数据挖掘类 商业智能,如统计报表; 用户体验分析,预测流失用户。 以上是根据本人求职季有限的接触所

jopen 2015-01-14   39311   0

金矿边上卖铁锹:Dato为数据科学家提供机器学习系统 资讯

人,怎么搭建自己的大规模机器学习系统呢?当然也可以选择开源社区的优秀机器学习系统,比如SparkStorm。但使用开源系统时碰到问题,就会陷入 无人支持的困境。 36氪介绍过的Dato正是提供

jopen 2015-07-23   21285   0

60+ 必须拥有的jQuery插件 资讯

impressively designed menus. Smooth Ajax adds the spark, blue is the color, rest is history. Page Scroller

jopen 2013-06-04   16920   0
jQuery  

TensorFlow 1.0正式发布 你需要知道的都在这里 资讯

中文手册、精华文章和 TF 社区等诸多板块。 Tensorflow 全网最全学习资料汇总之框架平台的综合对比【3】 作为机器学习领域、尤其是 Python 生态圈最受欢迎的框架平台,TensorFlow

jopen 2017-02-16   51108   0
1 2 3 4 5 6 7 8 9 10