我理解的大数据 资讯

算法,因为似乎一 二十年前大学计算机课本里的《机器学习》就一直在讲这些东西,很久前互联网上就在用算法过滤垃圾邮件了,今天看起来也没有什么本质的改进。 后来我琢磨了很久,发现大家讲的大数据其实

jopen 2014-11-30   23780   0

Yelp是如何用数据驱动搜索过滤器的? 经验

语言模型: 可以将该模型看作一个函数,输入一个单词序列,输出单词序列的概率估计。该模型是定理的一个简单应用。在查询一定的情况下,它可以计算出所 有过滤器的先验概率P(filter|que

jopen 2015-12-09   6032   0
yelp  

微软推 Azure 机器学习工具:Algorithm Cheat Sheet 资讯

包括以下模块:多类决策林、多类决策森林、多类逻辑回归、多类神经网络、一对多多类、双类平均感知器、双类点机、双类提升决策树、双类决策林、双类 决策森林、双类逻辑回归、双类神经网络、双类支持向量机、双类局部深层支持向量机。

jopen 2015-05-14   15864   0

Python周刊 156: Degen 资讯

来自 猎豹移动 - 全球最大的移动工具开发商 ... 项目 Python 中的 Kalman 以及过滤器 当然的, 是用 IPython notebook 创建的 Kalman 过滤器教材. 根据描述:"需要最低限制的数学知识

jopen 2015-07-28   28674   0
Python  

机器学习完全课程 经验

配套讲义 Pattern Recognition and Machine Learning 较难(偏) The Elements of Statistical Learning 较难 Understanding

passinger 2017-01-09   8606   0

机器学习系列:递归神经网络 经验

,很正常的会认为再次出现正面的概率是50%,但由于我们之前有对这个进行了实验,即有了经验了,按照定律,出现正面的概率肯定会大于50%。BP神经网络也少了对前面结果的一种反馈。 常见,易懂的受

thre1233 2017-03-24   86653   0

【机器学习快讯】20150124第一篇机器学习快讯 资讯

章整理罗列出来,等有时间或者遇到类似的问题的时候再看也是有益处的。 机器学习技术 12个用好朴素算法的小提示 使用随机森林:Use Random Forest: Testing 179 Classifiers

jopen 2015-01-24   26431   0

理论与实践:不要过度思考 资讯

品(我是说真正的使用),能让你运用直觉的能力,这是一种无法比拟的比推理更强大的能力。你瞬间的直觉顶得上你数小时的推理。而且你可能推理出一大堆错误的路线。 换一种方式说明这个道理:如果你认为这个主意

fmms 2012-03-19   10996   0

脑洞不要开得太大 苹果logo会有什么含义? 资讯

娃与亚当的故事。总之这些解读大可不必放在心上。 好在简单并没有让乔布望而却步。苹果如今这个 logo 的诞生就是因为乔布认为,苹果最开始使用的 logo 太过复杂,要被人记住不容易。所以他招聘

jopen 2015-01-06   4763   0
苹果  

数据挖掘学习笔记--决策树C4.5 经验

决策树为什么要剪枝?原因就是避免决策树“过拟合”样本。前面的算法生成的决策树非常的详细而庞大,每个属性都被详细地加以考虑,决策树的树节点所覆盖的训练样本都是“纯”的。因此用这个决策树来对训练样本进行分类的话,你会发现对于训练样本而言

jopen 2016-01-18   13349   0
P8

  关于信号与系统最通俗的解释,讲得真好! 文档

的文章,看到一上来就大段的公式就特别头疼。 第一课 什么是卷积 卷积有什么用 什么是傅利变换 什么是拉普拉变换  引子 很多朋友和我一样,工科电子类专业,学了一堆信号方面的课,什么都没学懂,背了公式考了试,然后毕业了。

applejuan 2011-11-09   3879   0
试题   Go  

程序员歪传 资讯

编程语言。从那时起,他一直在各种研究实验室之间流窜,尝试重新发明 BASIC 编程语言。像苹果,微软,迪尼这些公司都曾经付给他大笔金钱重塑 BASIC。除此之外的时间里,他没事就摆弄摆弄住宅里的管风琴,然后到各种行业活动中演讲骗钱。

jopen 2013-06-19   8579   0

图文并茂的神经网络架构大盘点:从基本原理到衍生关系 经验

。这有点回到本源的感觉,因为它们和 BM 及 RBM 的联系更紧密一点。但它们确实依赖于数学来处理概率推理和独立(probabilistic inference and independence

drf2lhlki 2016-09-19   145482   0

Spark 数据挖掘 - 利用决策树预测森林覆盖面积 资讯

回归和分类是使用年代最近研究的最充分的预测分析技术。很多算法开源包都包含通用的这些方法。比如:支持向量机,逻辑回归,朴素,神经网络和深度学习。 本文的重点是讨论:决策树和它的扩展随机森林。决策树是通用而且灵活的分类回归算法。

jopen 2015-11-03   32268   0
Spark  

FBI悬赏420万美元抓捕这五名黑客 资讯

头号通缉黑客的犯罪记录: 1. 夫根尼·米哈伊洛维奇· 博加乔夫赏金:300 万美元 夫根尼·米哈伊洛维奇·博加乔夫(Evgeniy Mikhailovich Bogachev)是“宙”(ZouS)木马背

jopen 2015-07-01   5202   0
黑客  

微软纽约研发中心挖走雅虎14名专家 资讯

日常运营。 微软拥有庞大的研发机构,包括 850 名博士。微软新英格兰研发中心负责人珍妮佛·查(Jennifer Chayes)表示,纽约研发中心将是该公司在全球建设的第 13 座研发中心。她也将兼任纽约研发中心主管。

fmms 2012-05-03   6795   0
微软  
P28

  TalkingData 基于 Spark 的数据挖掘工作 文档

为什么没有广泛使用MLLib内存资源有限,很多情况下无法把数据放入内存处理,因此迭代算法效率还是很低 迭代依然是阿格硫之蹱 我们只能尽可能使用需要迭代次数少,甚至不迭代的算法和算法实现RDTOne Iteration LRSimHash

pd3n 2014-12-03   545   0

部署大数据?请参考大数据分析平台架构(Big Data Analytics Platform) 经验

数据挖掘: 支持运行于分布式文件系统和分布式计算平台之上的分布式数据挖掘算法,具体包括:逻辑特回归、朴素 分类算法及其分布式实现;K均值、谱聚类算法及其分布式实现;潜在狄利克雷分配语义挖掘算法及其

jopen 2015-04-03   72981   0

20 个顶尖的 Python 机器学习开源项目 经验

是基于Scipy为机器学习建造的的一个Python模块,他的特色就是多样化的分类,回归和聚类的算法包括支持向量机,逻辑回归, 朴素分类器, 随机森林,Gradient Boosting,聚类算法和DBSCAN。而且也设计出了Python

b2f5 2015-06-08   457996   0

她月薪5万真的是因为选择了最艰难的路? 资讯

我不知道,因为我身边没有这样的例子,如果有,不妨告诉我。 其实,这类成功学鸡汤文是很容易被证伪的,稍作推理就可以证明文章说的因果并非因果关系,我相信可能吧的读者都是聪明人,如果你身边有喜欢看咪蒙的人,不妨

jopen 2017-03-17   5912   0
1 2 3 4 5 6 7 8 9 10