浏览器同源政策及其规避方法

kart 9年前
   <p>浏览器安全的基石是"同源政策"(<a href="/misc/goto?guid=4959670155264093847">same-origin policy</a>)。很多开发者都知道这一点,但了解得不全面。</p>    <p>本文详细介绍"同源政策"的各个方面,以及如何规避它。</p>    <p><img alt="浏览器同源政策及其规避方法" src="https://simg.open-open.com/show/6a669ad1a7b76d1ae7a6f692d377f0d8.jpg"></p>    <h2>一、概述</h2>    <h3>1.1 含义</h3>    <p>1995年,同源政策由 Netscape 公司引入浏览器。目前,所有浏览器都实行这个政策。</p>    <p>最初,它的含义是指,A网页设置的 Cookie,B网页不能打开,除非这两个网页"同源"。所谓"同源"指的是"三个相同"。</p>    <blockquote>     <ul>      <li>协议相同</li>      <li>域名相同</li>      <li>端口相同</li>     </ul>    </blockquote>    <p>举例来说,<code>http://www.example.com/dir/page.html</code>这个网址,协议是<code>http://</code>,域名是<code>www.example.com</code>,端口是<code>80</code>(默认端口可以省略)。它的同源情况如下。</p>    <blockquote>     <ul>      <li><code>http://www.example.com/dir2/other.html</code>:同源</li>      <li><code>http://example.com/dir/other.html</code>:不同源(域名不同)</li>      <li><code>http://v2.www.example.com/dir/other.html</code>:不同源(域名不同)</li>      <li><code>http://www.example.com:81/dir/other.html</code>:不同源(端口不同)</li>     </ul>    </blockquote>    <h3>1.2 目的</h3>    <p>同源政策的目的,是为了保证用户信息的安全,防止恶意的网站窃取数据。</p>    <p>设想这样一种情况:A网站是一家银行,用户登录以后,又去浏览其他网站。如果其他网站可以读取A网站的 Cookie,会发生什么?</p>    <p>很显然,如果 Cookie 包含隐私(比如存款总额),这些信息就会泄漏。更可怕的是,Cookie 往往用来保存用户的登录状态,如果用户没有退出登录,其他网站就可以冒充用户,为所欲为。因为浏览器同时还规定,提交表单不受同源政策的限制。</p>    <p>由此可见,"同源政策"是必需的,否则 Cookie 可以共享,互联网就毫无安全可言了。</p>    <h3>1.3 限制范围</h3>    <p>随着互联网的发展,"同源政策"越来越严格。目前,如果非同源,共有三种行为受到限制。</p>    <blockquote>     <p>(1) Cookie、LocalStorage 和 IndexDB 无法读取。</p>     <p>(2) DOM 无法获得。</p>     <p>(3) AJAX 请求不能发送。</p>    </blockquote>    <p>虽然这些限制是必要的,但是有时很不方便,合理的用途也受到影响。下面,我将详细介绍,如何规避上面三种限制。</p>    <h2>二、Cookie</h2>    <p>Cookie 是服务器写入浏览器的一小段信息,只有同源的网页才能共享。但是,两个网页一级域名相同,只是二级域名不同,浏览器允许通过设置<code>document.domain</code>共享 Cookie。</p>    <p>举例来说,A网页是<code>http://w1.example.com/a.html</code>,B网页是<code>http://w2.example.com/b.html</code>,那么只要设置相同的<code>document.domain</code>,两个网页就可以共享Cookie。</p>    <blockquote>     <pre>  <code class="language-javascript">  document.domain = 'example.com';  </code></pre>    </blockquote>    <p>现在,A网页通过脚本设置一个 Cookie。</p>    <blockquote>     <pre>  <code class="language-javascript">  document.cookie = "test1=hello";  </code></pre>    </blockquote>    <p>B网页就可以读到这个 Cookie。</p>    <blockquote>     <pre>  <code class="language-javascript">  var allCookie = document.cookie;  </code></pre>    </blockquote>    <p>注意,这种方法只适用于 Cookie 和 iframe 窗口,LocalStorage 和 IndexDB 无法通过这种方法,规避同源政策,而要使用下文介绍的PostMessage API。</p>    <p>另外,服务器也可以在设置Cookie的时候,指定Cookie的所属域名为一级域名,比如<code>.example.com</code>。</p>    <blockquote>     <pre>  <code class="language-javascript">  Set-Cookie: key=value; domain=.example.com; path=/  </code></pre>    </blockquote>    <p>这样的话,二级域名和三级域名不用做任何设置,都可以读取这个Cookie。</p>    <h2>三、iframe</h2>    <p>如果两个网页不同源,就无法拿到对方的DOM。典型的例子是<code>iframe</code>窗口和<code>window.open</code>方法打开的窗口,它们与父窗口无法通信。</p>    <p>比如,父窗口运行下面的命令,如果<code>iframe</code>窗口不是同源,就会报错。</p>    <blockquote>     <pre>  <code class="language-javascript">  document.getElementById("myIFrame").contentWindow.document  // Uncaught DOMException: Blocked a frame from accessing a cross-origin frame.  </code></pre>    </blockquote>    <p>上面命令中,父窗口想获取子窗口的DOM,因为跨源导致报错。</p>    <p>反之亦然,子窗口获取主窗口的DOM也会报错。</p>    <blockquote>     <pre>  <code class="language-javascript">  window.parent.document.body  // 报错  </code></pre>    </blockquote>    <p>如果两个窗口一级域名相同,只是二级域名不同,那么设置上一节介绍的<code>document.domain</code>属性,就可以规避同源政策,拿到DOM。</p>    <p>对于完全不同源的网站,目前有三种方法,可以解决跨域窗口的通信问题。</p>    <blockquote>     <ul>      <li>片段识别符(fragment identifier)</li>      <li>window.name</li>      <li>跨文档通信API(Cross-document messaging)</li>     </ul>    </blockquote>    <h3>3.1 片段识别符</h3>    <p>片段标识符(fragment identifier)指的是,URL的<code>#</code>号后面的部分,比如<code>http://example.com/x.html#fragment</code>的<code>#fragment</code>。如果只是改变片段标识符,页面不会重新刷新。</p>    <p>父窗口可以把信息,写入子窗口的片段标识符。</p>    <blockquote>     <pre>  <code class="language-javascript">  var src = originURL + '#' + data;  document.getElementById('myIFrame').src = src;  </code></pre>    </blockquote>    <p>子窗口通过监听<code>hashchange</code>事件得到通知。</p>    <blockquote>     <pre>  <code class="language-javascript">  window.onhashchange = checkMessage;    function checkMessage() {    var message = window.location.hash;    // ...  }  </code></pre>    </blockquote>    <p>同样的,子窗口也可以改变父窗口的片段标识符。</p>    <blockquote>     <pre>  <code class="language-javascript">  parent.location.href= target + "#" + hash;  </code></pre>    </blockquote>    <h3>3.2 window.name</h3>    <p>浏览器窗口有<code>window.name</code>属性。这个属性的最大特点是,无论是否同源,只要在同一个窗口里,前一个网页设置了这个属性,后一个网页可以读取它。</p>    <p>父窗口先打开一个子窗口,载入一个不同源的网页,该网页将信息写入<code>window.name</code>属性。</p>    <blockquote>     <pre>  <code class="language-javascript">  window.name = data;  </code></pre>    </blockquote>    <p>接着,子窗口跳回一个与主窗口同域的网址。</p>    <blockquote>     <pre>  <code class="language-javascript">  location = '<a class="token url-link" href="/misc/goto?guid=4959670155352710380">http://parent.url.com/xxx.html</a>';  </code></pre>    </blockquote>    <p>然后,主窗口就可以读取子窗口的<code>window.name</code>了。</p>    <blockquote>     <pre>  <code class="language-javascript">  var data = document.getElementById('myFrame').contentWindow.name;  </code></pre>    </blockquote>    <p>这种方法的优点是,<code>window.name</code>容量很大,可以放置非常长的字符串;缺点是必须监听子窗口<code>window.name</code>属性的变化,影响网页性能。</p>    <h3>3.3 window.postMessage</h3>    <p>上面两种方法都属于破解,HTML5为了解决这个问题,引入了一个全新的API:跨文档通信 API(Cross-document messaging)。</p>    <p>这个API为<code>window</code>对象新增了一个<code>window.postMessage</code>方法,允许跨窗口通信,不论这两个窗口是否同源。</p>    <p>举例来说,父窗口<code>http://aaa.com</code>向子窗口<code>http://bbb.com</code>发消息,调用<code>postMessage</code>方法就可以了。</p>    <blockquote>     <pre>  <code class="language-javascript">  var popup = window.open('<a class="token url-link" href="/misc/goto?guid=4959670155432397081">http://aaa.com</a>', 'title');  popup.postMessage('Hello World!', '<a class="token url-link" href="/misc/goto?guid=4959670155432397081">http://aaa.com</a>');  </code></pre>    </blockquote>    <p><code>postMessage</code>方法的第一个参数是具体的信息内容,第二个参数是接收消息的窗口的源(origin),即"协议 + 域名 + 端口"。也可以设为<code>*</code>,表示不限制域名,向所有窗口发送。</p>    <p>子窗口向父窗口发送消息的写法类似。</p>    <blockquote>     <pre>  <code class="language-javascript">  window.opener.postMessage('Nice to see you', '<a class="token url-link" href="/misc/goto?guid=4959670155516382907">http://bbb.com</a>');  </code></pre>    </blockquote>    <p>父窗口和子窗口都可以通过<code>message</code>事件,监听对方的消息。</p>    <blockquote>     <pre>  <code class="language-javascript">  window.addEventListener('message', function(e) {    console.log(e.data);  },false);  </code></pre>    </blockquote>    <p><code>message</code>事件的事件对象<code>event</code>,提供以下三个属性。</p>    <blockquote>     <ul>      <li><code>event.source</code>:发送消息的窗口</li>      <li><code>event.origin</code>: 消息发向的网址</li>      <li><code>event.data</code>: 消息内容</li>     </ul>    </blockquote>    <p>下面的例子是,子窗口通过<code>event.source</code>属性引用父窗口,然后发送消息。</p>    <blockquote>     <pre>  <code class="language-javascript">  window.addEventListener('message', receiveMessage);  function receiveMessage(event) {    event.source.postMessage('Nice to see you!', '*');  }  </code></pre>    </blockquote>    <p><code>event.origin</code>属性可以过滤不是发给本窗口的消息。</p>    <blockquote>     <pre>  <code class="language-javascript">  window.addEventListener('message', receiveMessage);  function receiveMessage(event) {    if (event.origin !== '<a class="token url-link" href="/misc/goto?guid=4959670155516382907">http://bbb.com</a>') return;    if (event.data === 'Hello World') {        event.source.postMessage('Hello', event.origin);    } else {      console.log(event.data);    }  }  </code></pre>    </blockquote>    <h3>3.4 LocalStorage</h3>    <p>通过<code>window.postMessage</code>,读写其他窗口的 LocalStorage 也成为了可能。</p>    <p>下面是一个例子,主窗口写入iframe子窗口的<code>localStorage</code>。</p>    <blockquote>     <pre>  <code class="language-javascript">  window.onmessage = function(e) {    if (e.origin !== '<a class="token url-link" href="/misc/goto?guid=4959670155516382907">http://bbb.com</a>') {      return;    }    var payload = JSON.parse(e.data);    localStorage.setItem(payload.key, JSON.stringify(payload.data));  };  </code></pre>    </blockquote>    <p>上面代码中,子窗口将父窗口发来的消息,写入自己的LocalStorage。</p>    <p>父窗口发送消息的代码如下。</p>    <blockquote>     <pre>  <code class="language-javascript">  var win = document.getElementsByTagName('iframe')[0].contentWindow;  var obj = { name: 'Jack' };  win.postMessage(JSON.stringify({key: 'storage', data: obj}), '<a class="token url-link" href="/misc/goto?guid=4959670155516382907">http://bbb.com</a>');  </code></pre>    </blockquote>    <p>加强版的子窗口接收消息的代码如下。</p>    <blockquote>     <pre>  <code class="language-javascript">  window.onmessage = function(e) {    if (e.origin !== '<a class="token url-link" href="/misc/goto?guid=4959670155516382907">http://bbb.com</a>') return;    var payload = JSON.parse(e.data);    switch (payload.method) {      case 'set':        localStorage.setItem(payload.key, JSON.stringify(payload.data));        break;      case 'get':        var parent = window.parent;        var data = localStorage.getItem(payload.key);        parent.postMessage(data, '<a class="token url-link" href="/misc/goto?guid=4959670155432397081">http://aaa.com</a>');        break;      case 'remove':        localStorage.removeItem(payload.key);        break;    }  };  </code></pre>    </blockquote>    <p>加强版的父窗口发送消息代码如下。</p>    <blockquote>     <pre>  <code class="language-javascript">  var win = document.getElementsByTagName('iframe')[0].contentWindow;  var obj = { name: 'Jack' };  // 存入对象  win.postMessage(JSON.stringify({key: 'storage', method: 'set', data: obj}), '<a class="token url-link" href="/misc/goto?guid=4959670155516382907">http://bbb.com</a>');  // 读取对象  win.postMessage(JSON.stringify({key: 'storage', method: "get"}), "*");  window.onmessage = function(e) {    if (e.origin != '<a class="token url-link" href="/misc/goto?guid=4959670155432397081">http://aaa.com</a>') return;    // "Jack"    console.log(JSON.parse(e.data).name);  };  </code></pre>    </blockquote>    <h2>四、AJAX</h2>    <p>同源政策规定,AJAX请求只能发给同源的网址,否则就报错。</p>    <p>除了架设服务器代理(浏览器请求同源服务器,再由后者请求外部服务),有三种方法规避这个限制。</p>    <blockquote>     <ul>      <li>JSONP</li>      <li>WebSocket</li>      <li>CORS</li>     </ul>    </blockquote>    <h3>4.1 JSONP</h3>    <p>JSONP是服务器与客户端跨源通信的常用方法。最大特点就是简单适用,老式浏览器全部支持,服务器改造非常小。</p>    <p>它的基本思想是,网页通过添加一个<code><script></code>元素,向服务器请求JSON数据,这种做法不受同源政策限制;服务器收到请求后,将数据放在一个指定名字的回调函数里传回来。</p>    <p>首先,网页动态插入<code><script></code>元素,由它向跨源网址发出请求。</p>    <blockquote>     <pre>  <code class="language-javascript">  function addScriptTag(src) {    var script = document.createElement('script');    script.setAttribute("type","text/javascript");    script.src = src;    document.body.appendChild(script);  }    window.onload = function () {    addScriptTag('<a class="token url-link" href="/misc/goto?guid=4959670155673014938">http://example.com/ip</a>?callback=foo');  }    function foo(data) {    console.log('Your public IP address is: ' + data.ip);  };  </code></pre>    </blockquote>    <p>上面代码通过动态添加<code><script></code>元素,向服务器<code>example.com</code>发出请求。注意,该请求的查询字符串有一个<code>callback</code>参数,用来指定回调函数的名字,这对于JSONP是必需的。</p>    <p>服务器收到这个请求以后,会将数据放在回调函数的参数位置返回。</p>    <blockquote>     <pre>  <code class="language-javascript">  foo({    "ip": "8.8.8.8"  });  </code></pre>    </blockquote>    <p>由于<code><script></code>元素请求的脚本,直接作为代码运行。这时,只要浏览器定义了<code>foo</code>函数,该函数就会立即调用。作为参数的JSON数据被视为JavaScript对象,而不是字符串,因此避免了使用<code>JSON.parse</code>的步骤。</p>    <h3>4.2 WebSocket</h3>    <p>WebSocket是一种通信协议,使用<code>ws://</code>(非加密)和<code>wss://</code>(加密)作为协议前缀。该协议不实行同源政策,只要服务器支持,就可以通过它进行跨源通信。</p>    <p>下面是一个例子,浏览器发出的WebSocket请求的头信息(摘自<a href="/misc/goto?guid=4959670155755601477">维基百科</a>)。</p>    <blockquote>     <pre>  <code class="language-javascript">  GET /chat HTTP/1.1  Host: server.example.com  Upgrade: websocket  Connection: Upgrade  Sec-WebSocket-Key: x3JJHMbDL1EzLkh9GBhXDw==  Sec-WebSocket-Protocol: chat, superchat  Sec-WebSocket-Version: 13  Origin: <a class="token url-link" href="/misc/goto?guid=4959650040751879955">http://example.com</a>  </code></pre>    </blockquote>    <p>上面代码中,有一个字段是<code>Origin</code>,表示该请求的请求源(origin),即发自哪个域名。</p>    <p>正是因为有了<code>Origin</code>这个字段,所以WebSocket才没有实行同源政策。因为服务器可以根据这个字段,判断是否许可本次通信。如果该域名在白名单内,服务器就会做出如下回应。</p>    <blockquote>     <pre>  <code class="language-bash">  HTTP/1.1 101 Switching Protocols  Upgrade: websocket  Connection: Upgrade  Sec-WebSocket-Accept: HSmrc0sMlYUkAGmm5OPpG2HaGWk=  Sec-WebSocket-Protocol: chat  </code></pre>    </blockquote>    <h3>4.3 CORS</h3>    <p>CORS是跨源资源分享(Cross-Origin Resource Sharing)的缩写。它是W3C标准,是跨源AJAX请求的根本解决方法。相比JSONP只能发<code>GET</code>请求,CORS允许任何类型的请求。</p>    <p>下一篇文章,我会详细介绍,如何通过CORS完成跨源AJAX请求。</p>