P42 Introduction Distributed Neural Network Algorithm What is Guagua? Guagua Advanced Features Shifu on Guagua Future Plans
P23 旅游行业垂直搜索的挑战整体架构语义解析&查询改写相关性&排序实时数据更新旅游行业垂直搜索的挑战产品设计上具有较强的引导性,难以满足目标不明确的用户需求产品种类繁多,差异化不明显,用户选择难度较大旅游属于服务行业,服务的价值不能直观的展现,如何挑选出最具性价比的产品产品价格和库存,跟日期、地点强相关,数据更新量大挑战目录旅游行业垂直搜索的挑战整体架构语义解析&查询改写相关性
P32 保证在各个平台可以正常使用保证照顾到各个平台的的性能保证各个平台的用户体验并照顾到平台差异性跨平台的标准怎样才叫跨平台123交互方式的不同事件的不同PC常见的交互有单击,双击,拖动,窗口缩放触屏常见的交互有点击,拖动,多点触控,各种传感器键盘手持设备有
P38 从应用角度来看知识图谱的价值和挑战科大讯飞研究院胡国平2014年10月17日武汉第二届全国中文知识图谱研讨会本次知识图谱研讨会着重探讨中文知识图谱的构建的资源、技术、方案、策略以及待研究问题和挑战促进研究单位之间以及研究界和产业界之间的学术交流探索今后大规模中文知识图谱构建的研讨与合作机制讯飞研究院简介科大讯飞公司(中文信息领域的三个上市公司之一)
P12 目录一.什么是抽象二.游戏的抽象三.烽火逻辑模式Q&A一.什么是抽象维基百科解释道:抽象化(Abstraction)是指以缩减一个概念或是一个现象的资讯含量来将其广义化(Generalization)的过程,主要是为了只保存和一特定目的有关的资讯。例如,将一个皮制的足球抽象化成一个球,只保留一般球的属性和行为等资讯。相似地,亦可以将快乐抽象化成一种情绪,以减少其在情绪中所含的资讯量。二.游戏的抽象场景一杨过升级到18级的时候,在古墓中消耗了1500元宝,意外抽中神将小龙女(暗金)
P15 一、熟悉行业、公司业务熟悉行业、公司业务及流程,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的实用价值;二、明确分析目的常常有朋友问我这些数据可以做什么分析?这是典型的为了分析而分析。数据分析的前提需要先明确分析目的,这样分析才有意义;三、运用营销、管理等理论营销、管理等理论是数据分析的指导思想,使分析思路系统化。例如4P理论等,从哪几个维度去分析?考虑哪几个方面?故而使数据分析变得有血有肉有脉络,真正做到理论指导实践;
P45 不一样的世界这一年,Clojure带给我温瑞云关于我倒腾了10年的开发C++、C#、Ruby、ClojureWord、UML、甘特图、燃尽图…Scrum支持者信奉Scrum价值观践行4年,始于草莽,归于无形翻译《Programming Clojure 2nd》正在为创建一个报警网络而工作话题讲一个故事,讲给还徘徊在Clojure门外,以及刚刚跨进来的同学听。故事的开始一个历史遗留系统开发阶段共3人参与,耗时近4个月。上线联调耗时1个半月。
P46 容量规划与保护大纲容量规划需要哪些数据单机容量依赖容量容量保护Webserver层面代码层面容量历程淘宝某应用某机房机器变化走势图机器预算经验应用能不能支撑?不知道经验 cpuload流量 结果如果遇到突发事件(全国哀悼日)流量突然上涨。应用支撑不住了就需要紧急加机器,加多少也不清楚,反正能加多少是多少,所有人都高度紧张。
P19 开发可掌控高并发服经验分享:非阻塞+异步化+队列小米瞿晋萍大纲服务端软件=排队服务回顾常见的并发模型介绍SEDA分享我们的经验把系统看成一个排队服务系统挑战:1)增加服务员的个数(充分利用多核)2)让每个服务员在保证可接受的时延(Ws)同时追求最大化的吞吐率(U)3)在客户到达率超过服务处理能力,仍然能保证一定的服务质量传统的半同步半异步并发模型传统HsHa的优缺点优点:简单缺点:依赖lock,对io密集型业务效率不高改进传统HsHa的方向I/O操作的异步化+非阻塞编程模型的优化服务的可掌控
P41 DRDS简介-起源起源DRDS脱胎于alibaba的cobra分布式数据库引擎06年上线使用在alibaba有近百应用在使用,目前已经开源DRDS的80%的代码出自cobraproxySql解析器执行流程配置DRDS简介-起源起源DRDS吸收了taobaoTDDL分布式数据库引擎的大量优秀经验和解决方案08年上线使用目前在使用的应用近千个大量实际应用解决方案支持分布式join分布式aggregation(groupsummaxmin)异步索引构建Autosharding,自动扩容缩容DRDS简介-起源从TDDL到DRDS DRDS专门针对外部用户进行了配置的重新设计简化了配置操作规范与流程尽可能使得应用像操作一个数据库一样的操作.
P49 Redis开源key-value存储系统曲延从目录索引Redis简介Redis安装Redis配置Redis支持的数据类型Redis的功能持久化(persistence)主从复制(master-slavereplication)事物支持(transaction)发布订阅(pub/sub)管道(pipeline)虚拟内存(vm)Redis性能Redis部署Redis应用场景Redis总结Redis简介Redis是一款开源的、高性能的键-值存储(key-valuestore)。它常被称作是一款数据结构服务器(datastructureserver)。
P40 Jstorm 是一个分布式实时计算引擎 类似Hadoop MR 用户按照规定的编程规范实现一个任务,将任务放到Jstorm上,Jstorm就将任务7 * 24 小时调度起来 Jstorm 比Storm 更稳定,功能更强大,更快。 Storm上跑的程序可以一行代码不变运行在Jstorm上
P79 Hadoop Technical Walkthrough HDFS Databases Using Hadoop in an Academic Environment Performance tips and other tools
P86 内容简介本PPT,为本人学习CPU架构以及并发程序设计的一些心得与收获。主要内容包括:简单介绍CPU的架构,部分主要模块及其功能(CacheStructure,CacheLine,Set-Way);CacheCoherence算法(MESI,MOESI);CPUMemoryOrdering模型(Atomic,Reorder,MemoryBarrier(Compiler,CPU),LockInstruction,LoadAcquire/StoreRelease);
P22 Forester数据: 迄今为止,打造了传统的企业数据仓库的机构,有83%的用户没有用数据仓库做数据分析,而是继续使用Excel等其他工具做数据分析。
P51 什么是HA?HA(High Availability)所谓的HA就是高可用,度量高可用行使用平均无故障时间(MTTF),可维护性使用平均维修时间(MTTR)来度量。计算计算机的可用性定义使用MTTF/(MTTF+MTTR)*100%公式来计算。为了达到这一目的就需要对提供服务器的设备提供冗余,在主设备挂掉的时候,从设备能够顶上来,代替主设备,再失效的设备恢复以后,可以优先成为主设备提供服务或者成为现在主设备的从设备。
P22 一般情况做什么监控?硬件监控网络带宽磁盘状态内存状态系统负载…软件性能监控Nginx连接数、吞吐量MySQL连接数、吞吐量…不足之处仅提供数值输出,被动依赖监控服务来获取数据监控埋点成本高实时性差无法反馈应用服务的状态信息ActionMoni狗眼UPYUN的服务监控系统特性支持TCP/UDP/HTTP/WebSocket接口支持counter和average操作支持历史数据持久化存储每秒可提供超10万个操作实时查询接口提供多个语言的Client(TCP/UDP)怎么做服务监控?
P61 SequoiaDB是一个领先的NoSQL数据库,它促进了大数据的应用和发展。而有了大数据,企业能够: 1.实现原本很难处理的业务。如社交网络,通过SequoiaDB水平扩张和动态数据类型的特性,来支持不断增长的用户群和日渐复杂的用户活动。 2.适应和发展竞争优势。如电子消费供应商,可以基于SequoiaDB搭建云服务。 3.提升客户体验。一家媒体公司通过定制服务内容和与读者的互动,增加了广告收入和用户参与度。 4.减少开销。如某银行,通过使用SequoiaDB替代传统的基础设施,不仅满足了新的需求,还节省了80%的软硬件成本。
P41 案例1-应用不时Load飙高案例2-Perm区GC频繁性能调优工具及原理介绍JTopBTrace案例1:应用不时Load飙高奇怪的现象不定时Load飙高20以上,有时候40以上重启后长时间Load正常早上重启应用,一天表示都正常查看哪个线程占用大量CPU?
P81 数据模型介绍数据仓库的定义面向主题Subject Oriented典型的主题领域:当事人;产品;事件;协议集成的Integrated数据来自分散的系统,需要进行统一的抽取,加工,加载相对稳定的Non-Volatile不可更新,提供决策分析随时间变化TimeVariant数据仓库中的时间期限要远远长于操作型系统中的时间期限(5~10年)数据仓库中的数据是一系列某一时刻生成的复杂的快照数据集合