大数据与机器学习周报 第5期

jopen 8年前

新闻

  1. 《非死book发布了新工具AAT,盲人也可以“看到”图片内容了》 :非死book 新发布了一个工具——自动选择文本( Automatic Alternative Text ,以下简称 AAT ),通过物体识别技术识别图像内容并读出相关文本,帮助盲人和视力障碍者 “看到” 网站上的图片。这个工具由 非死book 的无障碍小组研发,他们已经在这一项工具的研发上花费了几个月的精力

  2. 《Salesforce收购人工智能初创公司MetaMind》 :对于此次收购,MetaMind 的联合创始人兼 CEO Richard Socher 表示:“Salesforce 打算将 MetaMind 的技术融入到 Salesforce 的产品中去。对于 Salesforce 的非付费用户,MetaMind 产品将于 5月4日 正式停止服务;对于 Salesforce 的付费用户,MetaMind 将于 6月4日 正式停止服务。我们将在 4月11日 后开始删除用户储存在上面的数据。”

  3. 《麻省理工学院推出“数据美国”大数据可视化工具》 :数据美国”项目得益于美国总统奥巴马2013年签署的一项政务数据公开(Open Data)法令,要求所有新增政府数据都必须以电脑文件形式向企业、研究者和公众开放。当时的美国联邦政府CIO Steven VanRoekel以GPS和天气数据对公众开放催生导航市场为例,指出开放数据将推动企业创新。奥巴马认为,政务数据公开OpenData将刺激企业创新,增加就业机会,并提高政府执政效率

大数据

  1. 《深入对比数据科学工具箱:Python 和 R 之争》 :本文从应用场景、数据流编程、数据可视化、速度等多个方面对Python和R做了对比

  2. 《Spark在美团的实践》 :大数据处理渗透到了美团各业务线的各种应用场景,选择合适、高效的数据处理引擎能够大大提高数据生产的效率,进而间接或直接提升相关团队的工作效率

  3. 《你的大数据项目使用的工具正确吗?》 :工具/产品/解决方案是数据科学家洞察数据的利器。KDNuggets网站对此观点进行了年度调查,来分析数据科学家在用哪些类型的工具,并提供了调查的匿名原始数据

  4. 《专访卢亿雷:谈Hadoop生态的最新发展》 :在2016年Hadoop十岁生日之际,InfoQ策划了一个Hadoop热点系列文章,为大家梳理Hadoop这十年的变化,技术圈的生态状况,回顾以前,激励当下。本文是InfoQ处于一线开发的社区编辑对卢亿雷老师进行的采访,对大家关心的问题进行了专业的解答

  5. 《淘宝实战——教你数据挖掘好方法》 :下面通过4种对应的场景来帮助读者理解数据挖掘的4种任务

  6. 《大数据到底在用什么姿势塑造我们》 :从庞杂的数据背后挖掘、分析用户的行为习惯和喜好,找出更符合用户「口味」的产品和服务,并结合用户需求有针对性地调整和优化自身,就是大数据的价值

机器学习

  1. 《硅谷认为人工智能是下一个热点》 :当硅谷巨头们还在讨论最新的科技热潮是否正在滑向萧条时,关于什么会推动行业下一次井喷式发展的言论已经出现了。我们使用计算机的方式正在朝着这样一种趋势发展(如果以经验判断,这种趋势只是行业泡沫)——将海量数据储存在所谓的云计算中心,然后根据数据分析结果建立新的商业模式。与这种使用方式联系最紧密的词应该是 “机器学习” 和 “人工智能”,或者说是 “AI”。其所涉及市场催生的创新产品影响范围极广,从遍布全球的计算机系统到自助餐厅的支付方式

  2. 《谷歌大脑团队科学家出书了》

    经过两年半的努力,由谷歌大脑团队科学家 Ian Goodfellow, Yoshua Bengio and Aaron Courville撰写MIT出版的《Deep Learning》,今天完成最终稿了,打印版本还需要些时日

    </li>
  3. 《mxnet:结合R与GPU加速深度学习》 :近年来,深度学习可谓是机器学习方向的明星概念,不同的模型分别在图像处理与自然语言处理等任务中取得了前所未有的好成绩。在实际的应用中,大家除了关心模型的准确度,还常常希望能比较快速地完成模型的训练。一个常用的加速手段便是将模型放在GPU上进行训练。然而由于种种原因,R语言似乎缺少一个能够在GPU上训练深度学习模型的程序包

  4. 《将机器学习平台H2O应用于物联网》 :H2O是一个开源的、功能丰富的机器学习平台。它整合了R和Spark,且因其易用性而出名。本文是对其应用于物联网领域的概览

  5. 《2025年前实现大陆汽车无人驾驶技术纵览》 :众所周知,勇于创新的互联网巨头谷歌在2009年启动了无人驾驶汽车的试验研究,作为一家非汽车制造商,此举也让欧美日各大汽车制造商的无人驾驶技术浮出水面。Tesla甚至喊出要第一个将无人驾驶汽车推向市场。相比而言,汽车零部件巨头在自动驾驶领域的研发更显低调,今天我们就来看一看德国大陆汽车集团在这方面的技术储备

  6. </ol>

    感谢杜小芳对本文的审校。

    给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ,@丁晓昀),微信(微信号: InfoQChina )关注我们。

    </div>

    来自: http://www.infoq.com/cn/news/2016/04/Big-data-machine-learning-5