matlab机器学习和深度学习final


1© 2015 The MathWorks, Inc. MATLAB 基于机器学习和深度学习的数据分析方法 卓金武 MathWorks中国区 steven.zhuo@mathworks.cn 2 . 机器学习 – 何为机器学习、 – 机器学习的常见问题 – MATLAB机器学习技术 . Example 1: 基于机器学习的设备故障诊断 . Example 2: 基于机器学习的量化投资——批量选股 . 深度学习 – 深度学习Vs.机器学习? – 深度学习的技术实现 . Example 1: 基于机器学习的设备故障诊断 . 总结 内容提要 3 机器学习的应用领域 . 图像识别 . 语音识别 . 股票预测 . 医学诊断 . 数据分析 . 机器人 . 等等… [TBD] 4 何为机器学习 机器学习是用数据产生一个用于执行一个任务的程序 Standard Approach Machine Learning Approach 푚표푑푒푙 = < 푴풂풄풉풊풏풆 푳풆풂풓풏풊풏품 푨풍품풐풓풊풕풉풎 >(푠푒푛푠표푟_푑푎푡푎, 푎푐푡푖푣푖푡푦) Compute r Program Machine Learnin g 푚표푑푒푙: Inputs → Outputs Hand Written Program Formula or Equation If X_acc > 0.5 then “SITTING” If Y_acc < 4 and Z_acc > 5 then “STANDING” … 푌푎푐푡푖푣푖푡푦 = 훽1푋푎푐푐 + 훽2푌푎푐푐 + 훽3푍푎푐푐 + … 任务: 人类行为探测 5 机器学习流程 现有数据 已知结果 模型l 训练模型 模型 新数据 预测结果 预测 模型评估 选择模型 导入数据 探索数据 数据 准备数据 加速计算 6 机器学习算法分类 机器学习 有监督 分类 回归 无监督 聚类 Group and interpret data based only on input data Develop predictive model based on both input and output data 学习类型 算法类别 7 无监督学习 聚类 k-Means, Fuzzy C-Means Hierarchical Neural Networks Gaussian Mixture Hidden Markov Model 8 有监督学习 回归 Non-linear Reg. (GLM, Logistic) Linear RegressionDecision Trees Ensemble MethodsNeural Networks 分类 Nearest NeighborDiscriminant Analysis Naive BayesSupport Vector Machines 9 Sensor data from 100 engines of the same model Scenario 2: Have failure data . Performing scheduled maintenance . Failures still occurring (maybe by design) . Search records for when failures occurred and gather data preceding the failure events . Can we predict how long until failures will occur? Predictive Maintenance of Turbofan Engine Data provided by NASA PCoE http://ti.arc.nasa.gov/tech/dash/pcoe/prognostic-data-repository/ 10 How Data was Recorded ? Historical Live Engine1 Engine2 Engine100 Initial Use/ Prior Maintenance Time (Flights) Engine200 Recording Starts Failure Maintenance ? ? ? ? 11 Key points . Data preparation . Data exploration to get effective features . Train the suitable models . Predict with models 12 Integrate analytics with your enterprise systems MATLAB Compiler and MATLAB Coder .exe .lib .dll MATLAB Compiler SDK MATLAB Compiler MATLAB Runtime MATLAB Coder 13 Integrate analytics with your enterprise systems MATLAB Compiler and MATLAB Coder 14 Example : 基于交易数据的量化择股 Objective: 训练股票聚类和分类模型 Data:股票交易数据 Approach: – 提取有效特征 – 训练模型 – 用测试数据进行测试 Predictors 股票分类器 Response 买入好的股票,卖出坏的股票 数据点 数据点 层次聚类结果相关程度图 500 1000 1500 2000 2500 3000 3500 4000 4500 500 1000 1500 2000 2500 3000 3500 4000 4500 距离矩阵 :spearman 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 15 技术关键与结果 21111015172425 21828 7 8 6132230 1192312141627 326 920 4 529 0.5 0.6 0.7 0.8 0.9 1 数据点 距离 CPCC: 0.5406 股票的聚类结果——层次聚类 股票的分类模型——决策树 16 MATLAB在机器学习方面的优势和劣势 Steps Challenge Solution 获取、探索、分析数据 数据的多样性 扩展数据支持 signal, images, financial, Textual, geospatial, and several others formats 预处理数据 缺乏专业工具 高质量数据预处理函数库 Industry-standard algorithms for Finance, Statistics, Signal, Image processing 训练模型 周期长 可交互的APP操作流程 Focus on machine learning, not programing 评估模型 多种问题: 过度拟合 速度-精度-复杂度 集成的最佳实践 Model validation tools built into app Rich documentation with step by step guidance 反复 灵活的架构更适合定制化的流程 Complete machine learning platform 17 . 机器学习 – 何为机器学习、 – 机器学习的常见问题 – MATLAB机器学习技术 . Example 1: 基于机器学习的设备故障诊断 . Example 2: 基于机器学习的量化投资——批量选股 . 深度学习 – 深度学习Vs.机器学习? – 深度学习的技术实现 . Example 1: 基于机器学习的设备故障诊断 . 总结 内容提要 18 深度学习 . 本质:通过构建多隐层的模型和海量训练数据(可为无标签数 据),来学习更有用的特征,从而最终提升分类或预测的准确性。 “深度模型”是手段,“特征学习”是目的。 . 与浅层学习区别: 1)强调了模型结构的深度,通常有5-10多层的隐层节点; 2)明确突出了特征学习的重要性,通过逐层特征变换,将样本在原 空间的特征表示变换到一个新特征空间,从而使分类或预测更加 容易。与人工规则构造特征的方法相比,利用大数据来学习特征, 更能够刻画数据的丰富内在信息。 19 深度学习 . 好处:可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入 数据分布式表示。 20 深度学习 vs. 神经网络 神经网络 : 深度学习: 21 深度学习 vs. 神经网络 相同点:二者均采用分层结构,系统包括输入层、隐层(多层)、 输出层组成的多层网络,只有相邻层节点之间有连接,同一层 以及跨层节点之间相互无连接,每一层可以看作是一个 logistic 回归模型。 不同点: 神经网络:采用BP算法调整参数,即采用迭代算法来训练整个网 络。随机设定初值,计算当前网络的输出,然后根据当前输出 和样本真实标签之间的差去改变前面各层的参数,直到收敛; 深度学习:采用逐层训练机制。采用该机制的原因在于如果采用 BP机制,对于一个deep network(7层以上),残差传播到最 前面的层将变得很小,出现所谓的gradient diffusion(梯度 扩散)。 22 深度学习训练过程 . 第一步:采用自下而上的无监督学习 1)逐层构建单层神经元。 2)每层采用wake-sleep算法进行调优。每次仅调整一层,逐层调整。 这个过程可以看作是一个feature learning的过程,是和传统神经网络区别最 大的部分。 . 第二步:自顶向下的监督学习 23 Example : 基于深度学习的识别 Objective: 训练深度学习机 Approach: – 提取有效特征 – 训练深度学习模型 – 用测试数据进行测试 24 技术关键与结果 25 . 机器学习 – 何为机器学习、 – 机器学习的常见问题 – MATLAB机器学习技术 . Example 1: 基于机器学习的设备故障诊断 . Example 2: 基于机器学习的量化投资——批量选股 . 深度学习 – 深度学习Vs.机器学习? – 深度学习的技术实现 . Example 1: 基于机器学习的设备故障诊断 . 总结 内容提要 26 . 机器学习的适应场景: – 规则和方程太复杂时 . 脸谱、语音、模式识别…. – 规则和模型市场变化时 . 欺诈检测… – 数据的特征市场变化并且程序需要适应这种变化时 . 自动交易、能耗预测、供水预测… . 深度学习的适应场景: – 规则和方程不容易表达,并且一般机器学习方法效果不好时 . 股票预测、经济预测…. – 对准确度要求较高的大样本数据问题 . 指纹、图像识别….. 总结 27 更多学习资源 Documentation: mathworks.com/machine-learning 28 Questions and Discussion 谢谢,欢迎更多讨论! 29© 2015 The MathWorks, Inc. 联系我们: www.mathworks.cn 公司电话: 010-59827000 答疑方式: steven.zhuo@mathworks.cn
还剩28页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 10 金币 [ 分享pdf获得金币 ] 0 人已下载

下载pdf

pdf贡献者

lzbGame

贡献于2018-01-02

下载需要 10 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf