通过一张简单的图,让你彻底地、永久地搞懂JS的==运算

uuwi7991 8年前
   <p>大家知道,JavaScript中的==是一种比较复杂运算,它的运算规则很奇怪,很容易让人犯错,从而成为JavaScript中“最糟糕的特性”之一。</p>    <p>在仔细阅读ECMAScript规范的基础上,我画了一张图我想等你理解了这张图后,会彻底地弄懂关于==运算的一切。同时,我试图通过此文向大家证明==并不是那么糟糕的东西,它很容易掌握,甚至看起来很合理,并没那么糟糕。</p>    <p>先上图:</p>    <p style="text-align:center"><img alt="通过一张简单的图,让你彻底地、永久地搞懂JS的==运算" src="https://simg.open-open.com/show/26bfc773134f3fe42e4adc6b76df6bd4.png"></p>    <p style="text-align:center">图1 == 运算规则的图形化表示</p>    <p>==运算规则的精确描述在此:<a href="/misc/goto?guid=4959675485837869127" rel="nofollow noreferrer">The Abstract Equality Comparison Algorithm</a>。但是,这么复杂的描述,你确定看完后脑子不晕?确定立马就能拿它指导实践?</p>    <p>肯定不行,规范毕竟是给JavaScript运行环境的开发人员看的(比较V8引擎的开发人员们),而不是给语言的使用者看的。而上图正是将规范翻译成了方便大家看的形式。</p>    <p>在详细介绍图1中的每个部分前,我们来复习一下JS中关于类型的知识:</p>    <ol>     <li> <p>JS中的值有两种类型:基本类型、对象类型。</p> </li>     <li> <p>基本类型包括:Undefined、Null、Boolean、Number和String等五种类型。</p> </li>     <li> <p>Undefined类型和Null类型的都只有一个值,即undefined和null;Boolean类型有两个值:true和false;Number类型的值有很多很多;String类型的值有无数个值(理论上)。</p> </li>     <li> <p>所有对象都有valueOf()和toString()方法,它们继承自Object,当然也可能被子类重写。</p> </li>    </ol>    <p>现在考虑表达式:</p>    <pre>  <code>x == y  </code></pre>    <p>其中x和y是六种类型中某一种类型的值。</p>    <p>当x和y的类型相同时,x == y可以转化为x === y,而后者是很简单的(唯一需要注意的可能是NaN),所以下面我们只考虑x和y的类型不同的情况。</p>    <h2>一. 有和无</h2>    <p>在图1中,JavaScript值的六种类型用蓝底色的矩形表示。首先它们被分成了两组:</p>    <ul>     <li> <p>String、Number、Boolean和Object (对应左侧的大矩形框)</p> </li>     <li> <p>Undefined和Null (对应右侧的矩形框)</p> </li>    </ul>    <p>分组的依据是什么?我们来看一下,右侧的Undefined和Null是用来表示<strong>不确定</strong>、<strong>无</strong>或者<strong>空</strong>的,而右侧的四种类型都是<strong>确定的</strong>、<strong>有</strong>和<strong>非空</strong>。我们可以这样说:</p>    <blockquote>     <p>左侧是一个<strong>存在</strong>的世界,右侧是一个<strong>空</strong>的世界。</p>    </blockquote>    <p>所以,左右两个世界中的任意值做==比较的结果都是false是很合理的。(即图1中连接两个矩形的水平线上标的false)</p>    <h2>二. 空和空</h2>    <p>JavaScript中的undefined和null是另一个经常让我们崩溃的地方。通常它被认为是一个设计缺陷,这一点我们不去深究。不过我曾听说,JavaScript的作者最初是这样想的:</p>    <blockquote>     <p>假如你打算把一个变量赋予对象类型的值,但是现在还没有赋值,那么你可以用null表示此时的状态(证据之一就是typeof null 的结果是'object');相反,假如你打算把一个变量赋予原始类型的值,但是现在还没有赋值,那么你可以用undefined表示此时的状态。</p>    </blockquote>    <p>不管这个传闻是否可信,它们两者做==比较的结果是true也是很合理的。(即图1中右侧垂直线上标的true)</p>    <p>在进行下一步之前,我们先来说一下图1中的两个符号:大写字母N和P。这两个符号不是PN节中正和负的意思。而是:</p>    <ul>     <li> <p>N表示ToNumber操作,即将操作数转为数字。它是ES规范中的抽象操作,但我们可以用JS中的Number()函数来等价替代。</p> </li>     <li> <p>P表示ToPrimitive操作,即将操作数转为原始类型的值。它也是ES规范中的抽象操作,它也可以翻译成等价的JS代码。不过稍微复杂一些,简单说来,对于一个对象obj:</p> </li>    </ul>    <blockquote>     <p>ToPrimitive(obj)等价于:先计算obj.valueOf(),如果结果为原始值,则返回此结果;否则,计算obj.toString(),如果结果是原始值,则返回此结果;否则,抛出异常。</p>    </blockquote>    <p>注:此处有个例外,即Date类型的对象,它会先调用toString()方法.</p>    <p>在图1中,标有N或P的线表示,当它连接的两种类型的数据做==运算时,标有N或P的那一边的操作数要先执行ToNumber或ToPrimitive变换。</p>    <h2>三. 真与假</h2>    <p>从图1可以看出,当布尔值与其他类型的值作比较时,布尔值会转化为数字,具体来说</p>    <pre>  <code>true -> 1  false -> 0  </code></pre>    <p>这一点也不需浪费过多口舌。想一下在C语言中,根本没有布尔类型,通常用来表示逻辑真假的正是整数1和0。</p>    <h2>四. 字符的序列</h2>    <p>在图1中,我们把String和Number分成了一组。为什么呢?在六种类型中,String和Number都是字符的序列(至少在字面上如此)。字符串是所有合法的字符的序列,而数字可以看成是符合特定条件的字符的序列。所以,数字可以看成字符串的一个子集。</p>    <p>根据图1,在字符串和数字做==运算时,需要使用ToNumber操作,把字符串转化为数字。假设x是字符串,y是数字,那么:</p>    <pre>  <code>x == y -> Number(x) == y  </code></pre>    <p>那么字符串转化为数字的规则是怎样的呢?规范中描述得很复杂,但是大体来说,就是把字符串两边的引号去掉,然后看看它能否组成一个合法的数字。如果是,转化结果就是这个数字;否则,结果是NaN。例如:</p>    <pre>  <code>Number('123') // 结果123  Number('1.2e3') // 结果1200  Number('123abc') // 结果NaN  </code></pre>    <p>当然也有例外,比如空字符串转化为数字的结果是0。即</p>    <pre>  <code>Number('') // 结果0  </code></pre>    <h2>五. 单纯与复杂</h2>    <p>原始类型是一种单纯的类型,它们直接了当、容易理解。然而缺点是表达能力有限,难以扩展,所以就有了对象。对象是属性的集合,而属性本身又可以是对象。所以对象可以被构造得任意复杂,足以表示各种各样的事物。</p>    <p>但是,有时候事情复杂了也不是好事。比如一篇长长的论文,并不是每个人都有时间、有耐心或有必要从头到尾读一遍,通常只了解其中心思想就够了。于是论文就有了关键字、概述。JavaScript中的对象也一样,我们需要有一种手段了解它的主要特征,于是对象就有了toString()和valueOf()方法。</p>    <blockquote>     <p>toString()方法用来得到对象的一段文字描述;而valueOf()方法用来得到对象的特征值。</p>    </blockquote>    <p>当然,这只是我自己的理解。另外,顾名思义,toString()方法倾向于返回一个字符串。valueOf()方法呢?根据<a href="/misc/goto?guid=4959626577481001550" rel="nofollow noreferrer">规范中的描述</a>,它倾向于返回一个数字——尽管内置类型中,valueOf()方法返回数字的只有Number和Date。</p>    <p>根据图1,当一个对象与一个非对象比较时,需要将对象转化为原始类型(虽然与布尔类型比较时,需要先将布尔类型变成数字类型,但是接下来还是要将对象类型变成原始类型)。这也是合理的,毕竟==是不严格的相等比较,我们只需要取出对象的主要特征来参与运算,次要特征放在一边就行了。</p>    <h2>六. 万物皆数</h2>    <p>我们回过头来看一下图1。里面标有N或P的那几条连线是没有方向的。假如我们在这些线上标上箭头,是连线从标有N或P的那一端指向另一端,那么会得到(不考虑undefined和null):</p>    <p style="text-align:center"><img alt="通过一张简单的图,让你彻底地、永久地搞懂JS的==运算" src="https://simg.open-open.com/show/0d5d28b685f1f00269eea8e85d482908.png"></p>    <p style="text-align:center">图2 == 运算过程中类型转化的趋势</p>    <p>发现什么了吗?对,在运算过程中,所有类型的值都有一种向数字类型转化的趋势。毕竟曾经有名人说过:</p>    <blockquote>     <p>万物皆数。</p>    </blockquote>    <h2>七. 勉强举个栗子</h2>    <p>前面废话太多了,这里还是举个例子,来证明图1确实是方便有效可以指导实践的。</p>    <p>例,计算下面:</p>    <pre>  <code>[''] == false  </code></pre>    <p>首先,两个操作数分别是对象类型和布尔类型。根据图1,需要将布尔类型转为数字类型,而false转为数字的结果是0,所以表达式变为:</p>    <pre>  <code>[''] == 0  </code></pre>    <p>两个操作数变成了对象类型和数字类型。根据图1,需要将对象类型转为原始类型:</p>    <ul>     <li> <p>首先调用[].valueOf(),由于数组的valueOf()方法返回自身,所以结果不是原始类型,继续调用[].toString()。</p> </li>     <li> <p>对于数组来说,toString()方法的算法,是将每个元素都转为字符串类型,然后用','依次连接起来,所以最终结果是空字符串'',它是一个原始类型的值。</p> </li>    </ul>    <p>此时,表达式变为:</p>    <pre>  <code>'' == 0  </code></pre>    <p>两个操作数变成了字符串类型和数字类型,根据图1,需要将字符串类型转为数字类型,前面说了空字符串变成数字是0。于是表达式变为:</p>    <pre>  <code>0 == 0  </code></pre>    <p>到此为止,两个操作数的类型终于相同了,结果明显是true。</p>    <p>从这个例子可以看出,要想掌握==运算的规则,除了牢记图1外,还需要记住那些内置对象的toString()和valueOf()方法的规则。包括Object、Array、Date、Number、String、Boolean等。</p>    <h2>八. 总结一下</h2>    <p>前面说得很乱,在这里再总结一下图1中表达的==运算的规则:</p>    <ul>     <li> <p>undefined == null的结果是true。它俩与其他所有值比较的结果都是false。</p> </li>     <li> <p>字符串 == 数字时,字符串转为数字。</p> </li>     <li> <p>布尔值 == 其他类型时,布尔值转为数字。</p> </li>     <li> <p>对象 == 数字/字符串时,对象转为基本类型。</p> </li>    </ul>    <p>最后,我需要@一下<a href="/misc/goto?guid=4959675485946832360">Belleve</a>大神,为什么呢?因为整篇文章的思考,都是在看到他在<a href="/misc/goto?guid=4959675486035209557">https://www.zhihu.com/question/31442029</a>中的回答后做出的。当时他贴了一张图:</p>    <p style="text-align:center"><img alt="通过一张简单的图,让你彻底地、永久地搞懂JS的==运算" src="https://simg.open-open.com/show/9fe1bfa72176d5167915357bb940d474.png"></p>    <p>我看后觉得太复杂了,于是想能不能用一种更简单的方式来描述一下==运算,使大家更清晰更容易掌握。于是就有了此文,当然我不知道自己成功了没有。</p>    <p>OK,结束了。文章中的谬误,请不吝指出。</p>    <p>PS:最后,把图改了一下,仅供娱乐 : )</p>    <p style="text-align:center"><img alt="通过一张简单的图,让你彻底地、永久地搞懂JS的==运算" src="https://simg.open-open.com/show/bff60286ed1811bee503ce8cdc4a0722.png"></p>    <p>    <!-- end ngIf: ownPost(post) || !isCensoring -->    <!-- ngIf: !forceHideTipjar && !isCensoring && (post.tipjarState == 'activated' || (ownPost(post) && post.tipjarState != 'closed')) -->    <!-- ngIf: isPublished -->    <!-- ngIf: post.reviewers -->    <!-- ngIf: post.topics.length --></p>    <p style="text-align:center">    <!-- ngRepeat: topic in post.topics | limitTo:3 -->JavaScript     <!-- end ngRepeat: topic in post.topics | limitTo:3 -->ECMAScript</p>    <p><a href="/misc/goto?guid=4959675486120275482">阅读原文</a></p>    <p> </p>