Ja vaScript中Set对原始类型去重基于严格相等(===),但NaN视为相同、0与-0相等;包装对象不自动解包,需显式转换;空字符串、0、false等互不相等。

说到Ja vaScript里用Set给数组去重,很多人觉得简单直接。但你是否想过,当你往里扔数字、字符串这些原始类型时,Set到底是怎么判断“重复”的?答案就藏在严格相等(===)比较规则里。它不搞任何隐式转换,也不理会引用包装,一切都按语言的底层规范来,既严谨,又有些意料之外的“小脾气”。
原始类型的值比较直接且确定
Set在处理原始值时,逻辑非常清晰:完全遵循严格相等算法。这意味着,什么情况会去重,什么情况会保留,其实都有据可循。
- 数字:这里有个特别之处。
0和-0在ES2015之后被规定为相等,所以new Set([0, -0])最终只会保留一个0。而NaN的情况更有意思:虽然NaN === NaN返回false,但Set内部特别约定,视所有NaN为相同值。所以new Set([NaN, NaN])的长度是1,这算是语言给我们的一个实用性的例外。 - 字符串:就是逐字符的精确比对。
“1”和1因为类型不同,在Set眼里就是两个独立元素,不会混为一谈。 - 布尔值、undefined、null:这几个值各自为政。
true、false、undefined、null之间互不相等,也绝不会和其他原始类型划上等号。 - Symbol:每个
Symbol()都是独一无二的存在,即便描述符相同,比如Symbol('a')和另一个Symbol('a'),在Set里也是两个独立项。 - BigInt:大整数类型的比较符合直觉。
1n === 1为false,而1n === 1n为true,Set能准确地进行区分和去重。
注意包装对象不会自动解包
这里是实践中一个常见的坑。如果你不小心传入了原始类型的包装对象,比如new String(“a”)或new Number(42),Set可不会好心帮你“拆箱”。
- 看看这个例子:
new Set([“a”, new String(“a”)])的长度会是2。原因很简单,字符串字面量是primitive(原始值),而new String(“a”)返回的是一个object(对象),严格相等比较下,两者类型不同。 - 同理,
new Set([42, new Number(42)])也会保留两个元素。 - 如果确实需要统一处理,就必须手动进行显式转换,比如调用
.valueOf()方法,或者在构造Set前,先用String()、Number()等函数处理一遍数据。
常见易错点提醒
根据经验,有几个细节特别容易让人栽跟头,值得单独拎出来强调一下:
立即学习“Ja va免费学习笔记(深入)”;
- 记住,
0、-0、+0在Set眼中是同一个值。 NaN虽然“自不相认”,但在Set的大家庭里,它只认第一个出现的同胞。- 空字符串
“”、数字0、布尔值false,还有null和undefined,它们彼此之间两两都不相等,Set不会将它们中的任何两个合并。 - 字符串比较是严格的,带不带前导零、字母大小写,都会导致被视为不同元素。
“01”和“1”,“A”和“a”,都不会被模糊匹配掉。
摸透这些门道之后,你会发现Set对原始类型的去重行为其实相当可靠。它不猜测、不推断,只是忠实地执行语言规范定义的那套相等逻辑。用好了,它就是数据清洗时一把锋利且准绳清晰的工具。
