大话处理器


20nm 40nm 时钟基准 综合基准 专业评估组织基准 PC上的应用程序在每一代处理器上都可以正 常运行 PC上的程序不能在手机上运行,如果程序在 手机平台上重新编译即可在手机上运行 例如数组,数组中的元素常常按照顺序依次被 程序访问。 集成电路工艺 性能 功耗 提高程序开发、调试的效率 较好的Bug定位手段 较多的函数库减轻工作量 将高级语言转换成处理器二进制代码 二进制兼容 源代码兼容 x86 ARM MIPS Power DSP VLIW 超标量 SIMD SMT 多核 多处理器 如果某个数据被访问,那么在不久的将来它很 可能再次被访问。如果将常用代码放在Cache 中,那么只是第一次取这些代码需要耗费时 间,以后这些代码每次都能被内核快速的访 问,也就节约了时间。 如果某项数据被访问,那么与它相邻的数据很 可能很快就被访问。 用”锁“来防止多线程访问同一份数据 一块芯片包含不同类型的处理器内核,或者一 块芯片包含处理器+硬件加速器的结构 一块芯片只有一种类型的处理器内核 Application processing,主要是指应用处理器, 上面运行操作系统和应用程序 手机就应用该处理器 用于Real-time embedded applications,即实时 性非常高的嵌入式系统 用于Micro-controller(微控制器),如工业控制 中的微控制器 数字电路就是模拟电路的抽象 计算机的逻辑设计业是一种抽象 软件中的函数 集成电路中的IP核 工业控制 通信网络 消费电子 移动设备 Architecture(架构) Instruction Set Architecture指令集体系结构 免去重复编写软件的痛苦 将软件、硬件解耦 一套指令集 一些寄存器 电子实现 量子实现 Microarchitecture ISA在处理器中的实现 最重要的两个 面积 接口 软件开发环境 编译器性能 软件兼容性 CISC(复杂指令集计算机) RISC(精简指令集计算机) 后RISC 指令存储在内存中,要被加载到内核中 流水线 指令并行 数据并行 线程并行 SIMD技术 由处理器流水线结构决定 时间局部性 空间局部性 常说的:内存速度慢 一次将数组中的多个元素从内存中复制到 Cache中 由于大块数据会被放在存储器中,简单局部变 量才会被放在寄存器中,因此应该尽量少用数 组、指针,多用简单局部变量 全局变量因为要被多个模块使用,不会被放到 寄存器中,局部变量才能放在寄存器中 对于访问时延较大的情况 处理器通常会提供对齐的数据访问指令和非对 齐的数据访问指令,对齐的数据访问指令效率 要远高于非对齐的数据访问指令 数据通信 SOC 处理器 Cortex-A Cortex-R Cortex-M 抽象是为了找出共性,屏蔽不重要的细节 比如 分层使得每层各司其职,只需要关注与上下层 的接口,不需要关注其它层的实现细节 有利于批量复制 规格的定义有章可循 比如 模块化设计要求 内核 存储器 外设与接口 CISC RISC CPU IP GPU IP DSP IP Video Engine IP 其他IP core 服务器(Server) PC机(Client) 嵌入式领域 简称 是什么 作用 组成 1.处理器物理实现 2.处理器微架构 3.指令集体系结构 Intel和AMD同是x86的Architecture,但各自使 用不同的Microarchitecture Microarchitecture等同于内核(Core) 硬件指标 软件指标 指处理器的指令集体系结构 指处理器的微架构,也就是内部实现的结构 ISA地位 分类 三者区别 1.取指 2.译码 3.执行 时间并行 空间并行 程序的执行时间 = 程序的指令数 * 程序执行的 周期数 * 每周期的时间 减少程序的指令数 减少指令的执行周期 减少时钟周期时间 SRAM在处理器内部作为Cache Cache作为连接内核和内存的桥梁 局部性 延时 吞吐量 调查程序各个模块(或函数)的执行时间 1.将小函数直接写成语句 2.将小函数写成宏 3.将函数声明为内联函数 少用数组,少用指针 少用全局变量 一次多访问一些数据 数据对齐访问 1.程序员写程序 2.编译器编译程序 3.处理器执行指令 优化第一高手 线程是处理器上执行程序的基本单位,为了让 多个核共同完成一项工作,工作首先要被分解 为线程,线程之后会被分配到不同的核上运行 多线程编程要注意线程间的同步 是一套并行编程架构。专为共享内存系统设 计,适用于多核处理器 SOC是System On Chip(片上系统)的缩 写,就是将整个系统做在一块芯片上。 SOC通常至少包含一个处理器内核 区分SOC与处理器 指一块独立的逻辑或电路设计,如处理器核、 存储器核等 是SOC的基本组成部分,SOC就是将一些IP通 过互联网络连接起来 奇数命名内核较成功,如ARM7、ARM9等; 偶数命名的内核,如ARM6、ARM8、ARM10 等,都不太成功 ARM11以后,改用Cortex这个品牌 Cortex分成3部分 比较器 加法器 编码器 解码器 多路复用器 1.抽象 2.分层 3.规整化 4.模块化 VHDL Verilog 处理器组成 指令集体系结构 指令集 IP核 计算机的3个类别 通用计算模型 冯诺依曼结构 ISA 处理器系统分层 Architecture与 Microarchitecture的区 别 选择处理器的考量因素 处理器的选择 处理器生态环境 Architecture Microarchitecture 指令集就像语言,定义语言不难,难的是让别 人接受你定义的语言。如果重新使用一套指令 集,与之配套的编译器、操作系统、各种应用 软件也要重新编写! 处理器的运算模型 指令集发展 指令处理(三级流水线) 内核的并行性 公式 提高性能的途径 速度和单位容量成本的关系 Cache 衡量内存速度的两个标准 软件性能优化的第一步 减少函数调用的方法 优化内存访问 软件从创作到使用的3个阶段 编译器 多线程编程 OpenMP 定义 IP核 ARM内核 组合逻辑电路 人类管理复杂事物的四招 硬件描述语言 初识处理器 指令集体系结构 微架构 处理器性能 存储器 编写高效代码 SOC ”芯“路历程 BY 郑其墉 QQ:673243675 【读书笔记】 大话处理器

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 10 金币 [ 分享pdf获得金币 ] 0 人已下载

下载pdf

pdf贡献者

wangzhenwo

贡献于2017-11-22

下载需要 10 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf