P18 基于relaylog的failover基于relaylog的relay-recover新版本VSR的优化基于relaylog的failoverGTID优势:auto_position,failover轻松劣势:log_slave_updates,版本限制基于relaylog优势:不用开启log_slave_updates,节省IO劣势:不能auto_position等原理
P61 大数据概况BigData,BigWorld传统的结构化数据依然是最常见的数据非结构化的情绪表达和客户行为快速增长企业现存的非结构化数据蕴含大量开放文本视频音频在业务操作中被使用博客,论坛以及评论反映了客户的声音volume30%组织需要每天处理>100GB数据批处理更新从每天提升到每小时,每分钟,甚至实时复杂事件处理能够即时产生信息发送给分析系统实时流数据处理大数据.
P12 Spark:完整生态系统Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台。它立足于内存计算,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计算范式。Spark当下已成为Apache基金会的顶级开源项目,拥有着庞大的社区支持,技术也逐渐走向成熟。Cloudera,MapR,Amazon,SAS等众多知名都引入了Spark
P20 Goole文本搜索、图片搜索、地图等业务规模:网页搜索数达到80亿,8.8亿图片数据中心:租用为主搜索向专有领域扩展:新闻/财经/专利等向社交领域扩展:Blogger/google+业务规模:一万亿个独立网址、直至150+种语言翻译数据中心:开始投资构建自己的数据中心搜索向实时性、数据分析后的推送扩展:实时搜索、GoogleNow、Knowledge Graph等业务规模:数据中心:全球13个数据中心,管理近200万台计算机海量数据的搜集、存储快速响应用户的搜索请求多数据中心的数据管理、数据中心管理针对.
P21 Docker Chinese community 2. Docker & Docker Governance 3. Namespaces & Cgoups 4. Storage Drive Kernel -> AUFS 5. Docker Hub & Docker Registry 7. Community Version Docker Hub -> docker-bucket 8. OpenSource Projects Base Docker
P22 一般情况做什么监控?硬件监控网络带宽磁盘状态内存状态系统负载…软件性能监控Nginx连接数、吞吐量MySQL连接数、吞吐量…不足之处仅提供数值输出,被动依赖监控服务来获取数据监控埋点成本高实时性差无法反馈应用服务的状态信息ActionMoni狗眼UPYUN的服务监控系统特性支持TCP/UDP/HTTP/WebSocket接口支持counter和average操作支持历史数据持久化存储每秒可提供超10万个操作实时查询接口提供多个语言的Client(TCP/UDP)怎么做服务监控?
P24 namespace+cgroup相当于hypervisor,都提供了虚拟化环境以及资源隔离功能 aufs是个联合文件系统,同一个机器上的container往往是同质或者同一个基础镜像的。aufs使得一个container的镜像非常小,相对于基础镜像的增量部分。这是docker非常依赖的
P28 引言本文用lucene和Heritrix构建了一个Web搜索应用程序Lucene是基于Java的全文信息检索包,它目前是ApacheJakarta家族下面的一个开源项目。Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。Heritrix是一个纯由Java开发的、开源的Web网络爬虫,用户可以使用它从网络上抓取想要的资源。
P66 序一些基本概念操作系统的基本概念I386系统的基本概念Linux简介源码阅读和project环境Linux2.6.26源码简介操作系统的基本概念任何计算机系统都包含一个基本的程序集合,称为操作系统。内核(进程管理,进程调度,进程间通讯机制,内存管理,中断异常处理,文件系统,I/O系统,网络部分)其他程序(例如函数库,shell程序等等)操作系统的目的与硬件交互,管理所有的硬件资源为用户程序(应用程序)提供一个良好的执行环境I386系统的基本概念代码的运行堆栈的概念内核态与用户态中断/异常/系统调用虚拟内存代码的运行关键寄存器cs:eip:总是指向下一条的指令地址顺序执行:总是指向地址连续的下一条指令跳转/分支:执行这样的指令的时候.
P71 Redis介绍1,简介2,API3,redis高级实用特性3.1,安全性3.2,持久化机制3.3,主从复制3.4,过期时间设置3.5,事务处理3.6,发布订阅消息3.7,虚拟内存的使用.
P16 Druid数据库连接池的特点稳定高效率可扩展可监控可动态配置防SQL注入稳定阿里巴巴大规模部署应用超过500个部署实例超过3000最大集群超过60台我们大规模使用中,开源连接池只有两个是稳定的:Druid DataSource Jboss DataSource(历史原因还在使用)稳定的特性-ExceptionSorter当连接产生不可恢复的异常时,需要及时从连接池中清除,否则会产生大量错误。这个功能也称为ExceptionSorter,只有JBossDataSource和DruidDataSource实现了这个功能。OracleFatalExcetionMySqlFatalException高性能详细测试信息:
P55 大纲深度学习简介基础问题:语言表示问题WordEmbedding不同粒度语言单元的表示字符/单字/单词/短语/句子/文档值得重点关注的模型RAE/TensorNetwork/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考*深度学习(表示学习)*深度学习(表示学习
P69 达到的目标基本理解JVM垃圾回收算法基本理解JVM垃圾回收器Java对象的大小基本数据的类型的大小是固定的,这里就不多说了。对于非基本类型的Java对象,其大小就值得商榷。在Java中,一个空Object对象的大小是8byte,这个大小只是保存堆中一个没有任何属性的对象的大小。
P27 SQL触发器*讲座目标了解为什么需要触发器理解触发器的工作原理掌握如何使用inserted表和deleted表掌握如何创建:INSERT触发器UPDATE触发器DELETE触发器*为什么需要触发器(TRIGGER)呢?典型的应用就是银行的取款机系统为什么需要触发器演示:为什么需要触发器.sql帐户信息表bank交易信息表transInfo张三取钱200问题:没有自动修改张三的余额最优的解决方案就是采用触发器:它是一种特殊的存储过程也具备事务的功能它能在多表之间执行特殊的业务规则张三开户1000元。
P41 指尖上的网民,央视市场研究最新出炉,2014年移动互联网用户行为分析
P21 TDS安装安装完成后:运行Web管理工具,登录:superadmin/secret。添加服务器,再次运行Web管理工具,用cn=root进行登录,即可管理LDAP.安装:添加后缀可以是域,也可以是组织dc=com(domain)oro=soa(organization)组织机构示例
P55 SmartGWT是一款基于GWT的ajax框架(RIA框架),SmartGWT不仅能提供一整套的基于Ajax的UI体验(这点和ExtJs,jQuery等ajax框架一样,提供了完整的基于Ajax的UI),同时SmartGWT用户可以很容易的把UI的widget于后台服务器绑定,并且通过SmartGWT的UI widget于服务器通信,使用SmartGWT 2.0可以轻松的打造出一套UI华丽的RIA应用程序。 SmartGWT基于SmartClient库开发,是一个开源的项目,SmartGWT的源码方在googlecode主机上,SmartClient是一个企业级的ajax框架,包括非常出色的UI库、工具库和客户端服务端数据绑定等功能。
P44 第一章:概述什么样的SQL需要优化常见的问题发现问题的方法什么样的SQL需要优化引发严重的等待事件消耗大量的系统资源(CPU/IO/MEM)运行时间超长不能满足压力测试指标常见的问题没有恰当的索引(全表扫描)没有使用到恰当的索引重编译问题多表关联条件不当或关联太多分区表没有分析,未能使用索引死锁发现问题的方法从
P75 什么是HACMP? 配置HACMP的规划和考虑 HACMP的安装和配置 HACMP的接管测试
P150 计算机系统概论第一章什么是计算机系统、计算机硬件和计算机软件?硬件和软件哪个更重要?解:P3计算机系统——计算机硬件、软件和数据通信设备的物理或逻辑的综合体。计算机硬件——计算机的物理实体。计算机软件——计算机运行所需的程序及相关资料。硬件和软件在计算机系统中相互依存,缺一不可,因此同样重要。