浏览器同源政策及其规避方法
kart
9年前
<p>浏览器安全的基石是"同源政策"(<a href="/misc/goto?guid=4959670155264093847">same-origin policy</a>)。很多开发者都知道这一点,但了解得不全面。</p> <p>本文详细介绍"同源政策"的各个方面,以及如何规避它。</p> <p><img alt="浏览器同源政策及其规避方法" src="https://simg.open-open.com/show/6a669ad1a7b76d1ae7a6f692d377f0d8.jpg"></p> <h2>一、概述</h2> <h3>1.1 含义</h3> <p>1995年,同源政策由 Netscape 公司引入浏览器。目前,所有浏览器都实行这个政策。</p> <p>最初,它的含义是指,A网页设置的 Cookie,B网页不能打开,除非这两个网页"同源"。所谓"同源"指的是"三个相同"。</p> <blockquote> <ul> <li>协议相同</li> <li>域名相同</li> <li>端口相同</li> </ul> </blockquote> <p>举例来说,<code>http://www.example.com/dir/page.html</code>这个网址,协议是<code>http://</code>,域名是<code>www.example.com</code>,端口是<code>80</code>(默认端口可以省略)。它的同源情况如下。</p> <blockquote> <ul> <li><code>http://www.example.com/dir2/other.html</code>:同源</li> <li><code>http://example.com/dir/other.html</code>:不同源(域名不同)</li> <li><code>http://v2.www.example.com/dir/other.html</code>:不同源(域名不同)</li> <li><code>http://www.example.com:81/dir/other.html</code>:不同源(端口不同)</li> </ul> </blockquote> <h3>1.2 目的</h3> <p>同源政策的目的,是为了保证用户信息的安全,防止恶意的网站窃取数据。</p> <p>设想这样一种情况:A网站是一家银行,用户登录以后,又去浏览其他网站。如果其他网站可以读取A网站的 Cookie,会发生什么?</p> <p>很显然,如果 Cookie 包含隐私(比如存款总额),这些信息就会泄漏。更可怕的是,Cookie 往往用来保存用户的登录状态,如果用户没有退出登录,其他网站就可以冒充用户,为所欲为。因为浏览器同时还规定,提交表单不受同源政策的限制。</p> <p>由此可见,"同源政策"是必需的,否则 Cookie 可以共享,互联网就毫无安全可言了。</p> <h3>1.3 限制范围</h3> <p>随着互联网的发展,"同源政策"越来越严格。目前,如果非同源,共有三种行为受到限制。</p> <blockquote> <p>(1) Cookie、LocalStorage 和 IndexDB 无法读取。</p> <p>(2) DOM 无法获得。</p> <p>(3) AJAX 请求不能发送。</p> </blockquote> <p>虽然这些限制是必要的,但是有时很不方便,合理的用途也受到影响。下面,我将详细介绍,如何规避上面三种限制。</p> <h2>二、Cookie</h2> <p>Cookie 是服务器写入浏览器的一小段信息,只有同源的网页才能共享。但是,两个网页一级域名相同,只是二级域名不同,浏览器允许通过设置<code>document.domain</code>共享 Cookie。</p> <p>举例来说,A网页是<code>http://w1.example.com/a.html</code>,B网页是<code>http://w2.example.com/b.html</code>,那么只要设置相同的<code>document.domain</code>,两个网页就可以共享Cookie。</p> <blockquote> <pre> <code class="language-javascript"> document.domain = 'example.com'; </code></pre> </blockquote> <p>现在,A网页通过脚本设置一个 Cookie。</p> <blockquote> <pre> <code class="language-javascript"> document.cookie = "test1=hello"; </code></pre> </blockquote> <p>B网页就可以读到这个 Cookie。</p> <blockquote> <pre> <code class="language-javascript"> var allCookie = document.cookie; </code></pre> </blockquote> <p>注意,这种方法只适用于 Cookie 和 iframe 窗口,LocalStorage 和 IndexDB 无法通过这种方法,规避同源政策,而要使用下文介绍的PostMessage API。</p> <p>另外,服务器也可以在设置Cookie的时候,指定Cookie的所属域名为一级域名,比如<code>.example.com</code>。</p> <blockquote> <pre> <code class="language-javascript"> Set-Cookie: key=value; domain=.example.com; path=/ </code></pre> </blockquote> <p>这样的话,二级域名和三级域名不用做任何设置,都可以读取这个Cookie。</p> <h2>三、iframe</h2> <p>如果两个网页不同源,就无法拿到对方的DOM。典型的例子是<code>iframe</code>窗口和<code>window.open</code>方法打开的窗口,它们与父窗口无法通信。</p> <p>比如,父窗口运行下面的命令,如果<code>iframe</code>窗口不是同源,就会报错。</p> <blockquote> <pre> <code class="language-javascript"> document.getElementById("myIFrame").contentWindow.document // Uncaught DOMException: Blocked a frame from accessing a cross-origin frame. </code></pre> </blockquote> <p>上面命令中,父窗口想获取子窗口的DOM,因为跨源导致报错。</p> <p>反之亦然,子窗口获取主窗口的DOM也会报错。</p> <blockquote> <pre> <code class="language-javascript"> window.parent.document.body // 报错 </code></pre> </blockquote> <p>如果两个窗口一级域名相同,只是二级域名不同,那么设置上一节介绍的<code>document.domain</code>属性,就可以规避同源政策,拿到DOM。</p> <p>对于完全不同源的网站,目前有三种方法,可以解决跨域窗口的通信问题。</p> <blockquote> <ul> <li>片段识别符(fragment identifier)</li> <li>window.name</li> <li>跨文档通信API(Cross-document messaging)</li> </ul> </blockquote> <h3>3.1 片段识别符</h3> <p>片段标识符(fragment identifier)指的是,URL的<code>#</code>号后面的部分,比如<code>http://example.com/x.html#fragment</code>的<code>#fragment</code>。如果只是改变片段标识符,页面不会重新刷新。</p> <p>父窗口可以把信息,写入子窗口的片段标识符。</p> <blockquote> <pre> <code class="language-javascript"> var src = originURL + '#' + data; document.getElementById('myIFrame').src = src; </code></pre> </blockquote> <p>子窗口通过监听<code>hashchange</code>事件得到通知。</p> <blockquote> <pre> <code class="language-javascript"> window.onhashchange = checkMessage; function checkMessage() { var message = window.location.hash; // ... } </code></pre> </blockquote> <p>同样的,子窗口也可以改变父窗口的片段标识符。</p> <blockquote> <pre> <code class="language-javascript"> parent.location.href= target + "#" + hash; </code></pre> </blockquote> <h3>3.2 window.name</h3> <p>浏览器窗口有<code>window.name</code>属性。这个属性的最大特点是,无论是否同源,只要在同一个窗口里,前一个网页设置了这个属性,后一个网页可以读取它。</p> <p>父窗口先打开一个子窗口,载入一个不同源的网页,该网页将信息写入<code>window.name</code>属性。</p> <blockquote> <pre> <code class="language-javascript"> window.name = data; </code></pre> </blockquote> <p>接着,子窗口跳回一个与主窗口同域的网址。</p> <blockquote> <pre> <code class="language-javascript"> location = '<a class="token url-link" href="/misc/goto?guid=4959670155352710380">http://parent.url.com/xxx.html</a>'; </code></pre> </blockquote> <p>然后,主窗口就可以读取子窗口的<code>window.name</code>了。</p> <blockquote> <pre> <code class="language-javascript"> var data = document.getElementById('myFrame').contentWindow.name; </code></pre> </blockquote> <p>这种方法的优点是,<code>window.name</code>容量很大,可以放置非常长的字符串;缺点是必须监听子窗口<code>window.name</code>属性的变化,影响网页性能。</p> <h3>3.3 window.postMessage</h3> <p>上面两种方法都属于破解,HTML5为了解决这个问题,引入了一个全新的API:跨文档通信 API(Cross-document messaging)。</p> <p>这个API为<code>window</code>对象新增了一个<code>window.postMessage</code>方法,允许跨窗口通信,不论这两个窗口是否同源。</p> <p>举例来说,父窗口<code>http://aaa.com</code>向子窗口<code>http://bbb.com</code>发消息,调用<code>postMessage</code>方法就可以了。</p> <blockquote> <pre> <code class="language-javascript"> var popup = window.open('<a class="token url-link" href="/misc/goto?guid=4959670155432397081">http://aaa.com</a>', 'title'); popup.postMessage('Hello World!', '<a class="token url-link" href="/misc/goto?guid=4959670155432397081">http://aaa.com</a>'); </code></pre> </blockquote> <p><code>postMessage</code>方法的第一个参数是具体的信息内容,第二个参数是接收消息的窗口的源(origin),即"协议 + 域名 + 端口"。也可以设为<code>*</code>,表示不限制域名,向所有窗口发送。</p> <p>子窗口向父窗口发送消息的写法类似。</p> <blockquote> <pre> <code class="language-javascript"> window.opener.postMessage('Nice to see you', '<a class="token url-link" href="/misc/goto?guid=4959670155516382907">http://bbb.com</a>'); </code></pre> </blockquote> <p>父窗口和子窗口都可以通过<code>message</code>事件,监听对方的消息。</p> <blockquote> <pre> <code class="language-javascript"> window.addEventListener('message', function(e) { console.log(e.data); },false); </code></pre> </blockquote> <p><code>message</code>事件的事件对象<code>event</code>,提供以下三个属性。</p> <blockquote> <ul> <li><code>event.source</code>:发送消息的窗口</li> <li><code>event.origin</code>: 消息发向的网址</li> <li><code>event.data</code>: 消息内容</li> </ul> </blockquote> <p>下面的例子是,子窗口通过<code>event.source</code>属性引用父窗口,然后发送消息。</p> <blockquote> <pre> <code class="language-javascript"> window.addEventListener('message', receiveMessage); function receiveMessage(event) { event.source.postMessage('Nice to see you!', '*'); } </code></pre> </blockquote> <p><code>event.origin</code>属性可以过滤不是发给本窗口的消息。</p> <blockquote> <pre> <code class="language-javascript"> window.addEventListener('message', receiveMessage); function receiveMessage(event) { if (event.origin !== '<a class="token url-link" href="/misc/goto?guid=4959670155516382907">http://bbb.com</a>') return; if (event.data === 'Hello World') { event.source.postMessage('Hello', event.origin); } else { console.log(event.data); } } </code></pre> </blockquote> <h3>3.4 LocalStorage</h3> <p>通过<code>window.postMessage</code>,读写其他窗口的 LocalStorage 也成为了可能。</p> <p>下面是一个例子,主窗口写入iframe子窗口的<code>localStorage</code>。</p> <blockquote> <pre> <code class="language-javascript"> window.onmessage = function(e) { if (e.origin !== '<a class="token url-link" href="/misc/goto?guid=4959670155516382907">http://bbb.com</a>') { return; } var payload = JSON.parse(e.data); localStorage.setItem(payload.key, JSON.stringify(payload.data)); }; </code></pre> </blockquote> <p>上面代码中,子窗口将父窗口发来的消息,写入自己的LocalStorage。</p> <p>父窗口发送消息的代码如下。</p> <blockquote> <pre> <code class="language-javascript"> var win = document.getElementsByTagName('iframe')[0].contentWindow; var obj = { name: 'Jack' }; win.postMessage(JSON.stringify({key: 'storage', data: obj}), '<a class="token url-link" href="/misc/goto?guid=4959670155516382907">http://bbb.com</a>'); </code></pre> </blockquote> <p>加强版的子窗口接收消息的代码如下。</p> <blockquote> <pre> <code class="language-javascript"> window.onmessage = function(e) { if (e.origin !== '<a class="token url-link" href="/misc/goto?guid=4959670155516382907">http://bbb.com</a>') return; var payload = JSON.parse(e.data); switch (payload.method) { case 'set': localStorage.setItem(payload.key, JSON.stringify(payload.data)); break; case 'get': var parent = window.parent; var data = localStorage.getItem(payload.key); parent.postMessage(data, '<a class="token url-link" href="/misc/goto?guid=4959670155432397081">http://aaa.com</a>'); break; case 'remove': localStorage.removeItem(payload.key); break; } }; </code></pre> </blockquote> <p>加强版的父窗口发送消息代码如下。</p> <blockquote> <pre> <code class="language-javascript"> var win = document.getElementsByTagName('iframe')[0].contentWindow; var obj = { name: 'Jack' }; // 存入对象 win.postMessage(JSON.stringify({key: 'storage', method: 'set', data: obj}), '<a class="token url-link" href="/misc/goto?guid=4959670155516382907">http://bbb.com</a>'); // 读取对象 win.postMessage(JSON.stringify({key: 'storage', method: "get"}), "*"); window.onmessage = function(e) { if (e.origin != '<a class="token url-link" href="/misc/goto?guid=4959670155432397081">http://aaa.com</a>') return; // "Jack" console.log(JSON.parse(e.data).name); }; </code></pre> </blockquote> <h2>四、AJAX</h2> <p>同源政策规定,AJAX请求只能发给同源的网址,否则就报错。</p> <p>除了架设服务器代理(浏览器请求同源服务器,再由后者请求外部服务),有三种方法规避这个限制。</p> <blockquote> <ul> <li>JSONP</li> <li>WebSocket</li> <li>CORS</li> </ul> </blockquote> <h3>4.1 JSONP</h3> <p>JSONP是服务器与客户端跨源通信的常用方法。最大特点就是简单适用,老式浏览器全部支持,服务器改造非常小。</p> <p>它的基本思想是,网页通过添加一个<code><script></code>元素,向服务器请求JSON数据,这种做法不受同源政策限制;服务器收到请求后,将数据放在一个指定名字的回调函数里传回来。</p> <p>首先,网页动态插入<code><script></code>元素,由它向跨源网址发出请求。</p> <blockquote> <pre> <code class="language-javascript"> function addScriptTag(src) { var script = document.createElement('script'); script.setAttribute("type","text/javascript"); script.src = src; document.body.appendChild(script); } window.onload = function () { addScriptTag('<a class="token url-link" href="/misc/goto?guid=4959670155673014938">http://example.com/ip</a>?callback=foo'); } function foo(data) { console.log('Your public IP address is: ' + data.ip); }; </code></pre> </blockquote> <p>上面代码通过动态添加<code><script></code>元素,向服务器<code>example.com</code>发出请求。注意,该请求的查询字符串有一个<code>callback</code>参数,用来指定回调函数的名字,这对于JSONP是必需的。</p> <p>服务器收到这个请求以后,会将数据放在回调函数的参数位置返回。</p> <blockquote> <pre> <code class="language-javascript"> foo({ "ip": "8.8.8.8" }); </code></pre> </blockquote> <p>由于<code><script></code>元素请求的脚本,直接作为代码运行。这时,只要浏览器定义了<code>foo</code>函数,该函数就会立即调用。作为参数的JSON数据被视为JavaScript对象,而不是字符串,因此避免了使用<code>JSON.parse</code>的步骤。</p> <h3>4.2 WebSocket</h3> <p>WebSocket是一种通信协议,使用<code>ws://</code>(非加密)和<code>wss://</code>(加密)作为协议前缀。该协议不实行同源政策,只要服务器支持,就可以通过它进行跨源通信。</p> <p>下面是一个例子,浏览器发出的WebSocket请求的头信息(摘自<a href="/misc/goto?guid=4959670155755601477">维基百科</a>)。</p> <blockquote> <pre> <code class="language-javascript"> GET /chat HTTP/1.1 Host: server.example.com Upgrade: websocket Connection: Upgrade Sec-WebSocket-Key: x3JJHMbDL1EzLkh9GBhXDw== Sec-WebSocket-Protocol: chat, superchat Sec-WebSocket-Version: 13 Origin: <a class="token url-link" href="/misc/goto?guid=4959650040751879955">http://example.com</a> </code></pre> </blockquote> <p>上面代码中,有一个字段是<code>Origin</code>,表示该请求的请求源(origin),即发自哪个域名。</p> <p>正是因为有了<code>Origin</code>这个字段,所以WebSocket才没有实行同源政策。因为服务器可以根据这个字段,判断是否许可本次通信。如果该域名在白名单内,服务器就会做出如下回应。</p> <blockquote> <pre> <code class="language-bash"> HTTP/1.1 101 Switching Protocols Upgrade: websocket Connection: Upgrade Sec-WebSocket-Accept: HSmrc0sMlYUkAGmm5OPpG2HaGWk= Sec-WebSocket-Protocol: chat </code></pre> </blockquote> <h3>4.3 CORS</h3> <p>CORS是跨源资源分享(Cross-Origin Resource Sharing)的缩写。它是W3C标准,是跨源AJAX请求的根本解决方法。相比JSONP只能发<code>GET</code>请求,CORS允许任何类型的请求。</p> <p>下一篇文章,我会详细介绍,如何通过CORS完成跨源AJAX请求。</p>