http 206断点续传与文件下载原理解析

jopen 10年前

一、断点续传的原理

其实断点续传的原理很简单，就是在http的请求上和一般的下载有所不同而已。

打个比方，浏览器请求服务器上的一个文时，所发出的请求如下：

假设服务器域名为www.jizhuomi.com/android，文件名为down.zip。

get /down.zip http/1.1  accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-  excel, application/msword, application/vnd.ms-powerpoint, */*  accept-language: zh-cn  accept-encoding: gzip, deflate  user-agent: mozilla/4.0 (compatible; msie 5.01; windows nt 5.0)  connection: keep-alive

服务器收到请求后，按要求寻找请求的文件，提取文件的信息，然后返回给浏览器，返回信息如下：

content-length=106786028  accept-ranges=bytes  date=mon, 30 apr 2001 12:56:11 gmt  etag=w/"02ca57e173c11:95b"  content-type=application/octet-stream  server=microsoft-iis/5.0  last-modified=mon, 30 apr 2001 12:56:11 gmt

所谓断点续传，也就是要从文件已经下载的地方开始继续下载。所以在客户端浏览器传给web服务器的时候要多加一条信息--从哪里开始。

下面是用自己编的一个“浏览器”来传递请求信息给web服务器，要求从2000070字节开始。

get /down.zip http/1.0  user-agent: netfox  range: bytes=2000070-  accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2

仔细看一下就会发现多了一行 range: bytes=2000070-

这一行的意思就是告诉服务器down.zip这个文件从2000070字节开始传，前面的字节不用传了。

服务器收到这个请求以后，返回的信息如下：

206  content-length=106786028  content-range=bytes 2000070-106786027/106786028  date=mon, 30 apr 2001 12:55:20 gmt  etag=w/"02ca57e173c11:95b"  content-type=application/octet-stream  server=microsoft-iis/5.0  last-modified=mon, 30 apr 2001 12:55:20 gmt

和前面服务器返回的信息比较一下，就会发现增加了一行：

content-range=bytes 2000070-106786027/106786028

返回的代码也改为206了，而不再是200了。

知道了以上原理，就可以进行断点续传的编程了。

二.文件下载和在浏览器显示

文件下载原理主要控制来自于服务器端响应，浏览器或者httpClient自行读取IO流

Accept-Ranges:bytes  #接受类型  Access-Control-Allow-Origin:* #允许任何主机均可跨域访问，ajax同样可以  Access-Control-Max-Age:2592000  Cache-Control:public, max-age=31536000  Connection:keep-alive  Content-Disposition:attachment; filename="c501b_01_h264_sd_960_540.mp4"  Content-Length:14470485  Content-Transfer-Encoding:binary #传输类型，字节类型  Content-Type:video/mp4  #响应类型  Date:Sun, 25 Jan 2015 00:17:14 GM  #文件日期--注意，对于浏览器读取缓存而不重新请求服务器十分有用,用来检测静态文件有没有被修改  ETag:"lraEcGPNv-73F2tLNOKhuA8a6pFa" #

下面是一个简单的好PHP下载实例

<?php  $file_name="哈哈.jpg";//需要下载的文件  $file_name=iconv("utf-8","gb2312","$file_name");  $fp=fopen($file_name,"r+");//下载文件必须先要将文件打开，写入内存  if(!file_exists($file_name)){//判断文件是否存在      echo "文件不存在";      exit();  }  $file_size=filesize("a.jpg");//判断文件大小  //返回的文件  Header("Content-type: application/octet-stream");  //按照字节格式返回  Header("Accept-Ranges: bytes");  //返回文件大小  Header("Accept-Length: ".$file_size);  //弹出客户端对话框，对应的文件名  Header("Content-Disposition: attachment; filename=".$file_name);  //防止服务器瞬时压力增大，分段读取  $buffer=1024;  while(!feof($fp)){      $file_data=fread($fp,$buffer);      echo $file_data;  }  //关闭文件  fclose($fp);  ?>

三.关于在浏览器中显示文件内容

浏览器默认会显示一些 text/*,image/*,PDF类型的文件，但默认会变成自动下载，这是我们需要修改响应头为

Content-Disposition:inline; filename="c501b_01_h264_sd_960_540.mp4"

来自： http://my.oschina.net/ososchina/blog/371468

http 206断点续传与文件下载原理解析

相关经验

目录