前段时间看到有人在网上说javascript烂,原因之一是下面这个例子。
[20, 3, 10].sort();
// [10, 20, 3]
这样的结果看上去确实难以理解,说得好听是违反直觉,难听则是错得不可理喻,这门语言怎么会在这么简单的地方犯这么低级的错误。然而,虽然javascript设计上有一些缺陷,在这个行为上却不能背黑锅。一切都是有原因的。
我们知道javascript是一门动态类型的语言,换句话说在编译时不会对变量的类型做检查(作为一门在大多数环境下解释运行的脚本语言,也没有编译这样的机会。),换句话说变量没有和类型绑定(声明变量的时候不像静态类型语言那样String msg、Date now,而是用统一的var msg、var now),和这样的理念相一致的自然是,作为容器的数组对其中的元素的数据类型没有任何限制。
var elem=[1, ‘sit’, new Date()];
有了这个前提,我们再来看数组的排序。任何排序都要基于一定的标准,例如数字可以按照它们的大小,字符可以根据某种编码,对象可以根据它们的某种属性或者字符串形式。总之,对于某个需要排序的集合,需要在它们的元素间定义一个函数compare(a, b),当任意两个元素作为参数时,函数将依据大于、等于、小于三种情况,得出确定的结果。
对javascript中的数组排序,当没有给sort方法传入比较函数时,javascript的默认算法必须能够处理数组元素的数据类型任意的各种情况。而对所有数据类型都有效的排序标准,或者说所有数据类型都能转换成的可以进行比较的数据类型,就是字符串形式。所以javascript数组sort方法的第一步就是将其中的元素转换成字符串形式。
[20, 3, 10].sort();
// 相当于[‘20’, ‘3’, ‘10’].sort(),结果自然是[10, 20, 3]。
那么要将它们视作数字排序怎么办?很简单,只要给sort方法传入一个比较函数compare(a, b)。当a大于b时,返回一个固定的正值;a等于b时,返回0;a小于b时,返回一个固定的负数。一个既简单又容易想到的函数就是:
function compareNumbers(a, b) {
return a - b;
}
这样,我们只要:
[20, 3, 10].sort(compareNumbers);
// [3, 10, 20]
或者更简单地写作:
[20, 3, 10].sort(function (a, b) {
return a - b;
});
或者更更简单地写作(需要在支持ECMAScript6的环境下):
[20, 3, 10].sort((a, b) => a-b);
一定要使用比较函数吗?或者说数组一定要支持任意类型的元素吗?在ECMAScript6中,答案也是不一定的。ECMAScript6新增了固定元素数据类型的数组TypedArray,数据类型可以是各种取值范围和精度等级的数字,从Int8Array到Float64Array。使用这些数组,我们就可以理所当然地将元素视为数字排序:
var a=new Int32Array([20, 3, 10]);
a.sort();
// [3, 10, 20]