• 数组去重


    JavaScript学习笔记:数组去重

     

    话说面试常会碰到面试官会问JavaScript实现数组去重的问题,整理了一些有关于JavaScript数组去重的方法。下面这些数组去重的方法是自己收集和整理的。

    双重循环去重

    这个方法使用了两个for循环做遍历。整个思路是:

    • 构建一个空数组用来存放去重后的数组
    • 外面的for循环对原数组做遍历,每次从数组中取出一个元素与结果数组做对比
    • 如果原数组取出的元素与结果数组元素相同,则跳出循环;反之则将其存放到结果数组中

    代码如下:

     1 Array.prototype.unique1 = function () {
     2     // 构建一个新数组,存放结果
     3     var newArray = [this[0]];
     4     // for循环,每次从原数组中取出一个元素
     5     // 用取出的元素循环与结果数组对比
     6     for (var i = 1; i < this.length; i++) {
     7         var repeat = false;
     8         for (var j=0; j < newArray.length; j++) {
     9             // 原数组取出的元素与结果数组元素相同
    10             if(this[i] == newArray[j]) {
    11                 repeat = true;
    12                 break;
    13             }
    14         }
    15         if(!repeat) {
    16             // 如果结果数组中没有该元素,则存放到结果数组中
    17             newArray.push(this[i]);
    18         }
    19     }
    20     return newArray;
    21 }

    假设我们有一个这样的数组:

    1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1',`2`];
    2 
    3 arr.unique1(); // [1, 2, 3, 4, "a", "b", 56, 32, 34, "c", 5]

    据说这种方法比较耗时,费性能。简单做个测试(测试方法写得比较拙逼):

     1 function test () {
     2     var arr = [];
     3     for (var i = 0; i < 1000000; i++) {
     4         arr.push(Math.round(Math.random(i) * 10000));
     5     }
     6     doTest(arr, 1);
     7 }
     8 function doTest(arr, n) {
     9     var tStart = (new Date()).getTime();
    10     var re = arr.unique1();
    11     var tEnd = (new Date()).getTime();
    12     console.log('双重循环去重方法使用时间是:' + (tEnd - tStart) + 'ms');
    13     return re;
    14 }
    15 test();

    在Chrome控制器运行上面的代码,测试双重循环去重所费时间:11031ms

    上面的方法可以使用forEach()方法和indexOf()方法模拟实现:

    1 function unique1() {
    2     var newArray = [];
    3     this.forEach(function (index) {
    4         if (newArray.indexOf(index) == -1) {
    5             newArray.push(index);
    6         }
    7     });
    8     return newArray;
    9 }

    通过unique1.apply(arr)unique1.call(arr)调用。不过这种方法效率要快得多,同样的上面测试代码,所费时间5423ms,几乎快了一半。

    排序遍历去重

    先使用sort()方法对原数组做一个排序,排完序之后对数组做遍历,并且检查数组中的第i个元素与结果数组中最后一个元素是否相同。如果不同,则将元素放到结果数组中。

     1 Array.prototype.unique2 = function () {
     2     // 原数组先排序
     3     this.sort();
     4     // 构建一个新数组存放结果
     5     var newArray = [];
     6     for (var i = 1; i < this.length; i++) {
     7         // 检查原数中的第i个元素与结果中的最后一个元素是否相同
     8         // 因为排序了,所以重复元素会在相邻位置
     9         if(this[i] !== newArray[newArray.length - 1]) {
    10             // 如果不同,将元素放到结果数组中
    11             newArray.push(this[i]);
    12         }
    13     }
    14     return newArray;
    15 }

    例如:

    1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1','2'];
    2 arr.unique2(); // ["1", 1, 2, "2", 3, 32, 34, 4, 5, 56, "a", "b", "c"]

    这种方法有两个特色:

    • 去重后的数组会做排序,主要是因为原数在去重前做了排序
    • 去重后的数组,与数字相同的数字字符无法区分,比如'1'1

    使用同样的方法,测试所费时间:1232ms

    对象键值对法

    这种去重方法实现思路是:

    • 创建一个JavaScript对象以及新数组
    • 使用for循环遍历原数组,每次取出一个元素与JavaScript对象的键做对比
    • 如果不包含,将存入对象的元素的值推入到结果数组中,并且将存入object对象中该属性名的值设置为1

    代码如下:

     1 Array.prototype.unique3 = function () {
     2     // 构建一个新数组存放结果
     3     var newArray = [];
     4     // 创建一个空对象
     5     var object = {};
     6     // for循环时,每次取出一个元素与对象进行对比
     7     // 如果这个元素不重复,则将它存放到结果数中
     8     // 同时把这个元素的内容作为对象的一个属性,并赋值为1,
     9     // 存入到第2步建立的对象中
    10     for (var i = 0; i < this.length; i++){
    11         // 检测在object对象中是否包含遍历到的元素的值
    12         if(!object[typeof(this[i]) + this[i]]) {
    13             // 如果不包含,将存入对象的元素的值推入到结果数组中
    14             newArray.push(this[i]);
    15             // 如果不包含,存入object对象中该属性名的值设置为1
    16             object[typeof(this[i]) + this[i]] = 1;
    17         }
    18     }
    19     return newArray;
    20 }

    运行前面的示例:

    1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1','2'];
    2 arr.unique3(); // [1, 2, 3, 4, "a", "b", 56, 32, 34, "c", 5, "1", "2"]

    同样的,不同的键可能会被误认为一样;例如: a[1]a["1"] 。这种方法所费时间:621ms。 这种方法所费时间是最短,但就是占用内存大一些。

    除了上面几种方法,还有其他几种方法如下:

     1 // 方法四
     2 Array.prototype.unique4 = function () {
     3     // 构建一个新数组存放结果
     4     var newArray = [];
     5     // 遍历整个数组
     6     for (var i = 0; i < this.length; i++) {
     7         // 遍历是否有重复的值
     8         for (j = i + 1; j < this.length; j++) {
     9             // 如果有相同元素,自增i变量,跳出i的循环
    10             if(this[i] === this[j]) {
    11                 j = ++i;
    12             }
    13         }
    14         // 如果没有相同元素,将元素推入到结果数组中
    15         newArray.push(this[i]);
    16     }
    17     return newArray;
    18 }

    Chrome测试结果

    1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1','2'];
    2 arr.unique4(); // ["a", 1, 3, 4, 56, 32, 34, 2, "b", "c", 5, "1", "2"]

    同样的,1'1'无法区分。

     1 // 方法五
     2 Array.prototype.unique5 = function () {
     3     // 构建一个新数组存放结果
     4     var newArray = [];
     5     // 遍历整个数组
     6     for (var i = 0; i < this.length; i++) {
     7         // 如果当前数组的第i值保存到临时数组,那么跳过
     8         var index = this[i];
     9         // 如果数组项不在结果数组中,将这个值推入结果数组中
    10         if (newArray.indexOf(index) === -1) {
    11             newArray.push(index);
    12         }
    13     }
    14     return newArray;
    15 }

    Chrome测试结果:

    1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1','2'];
    2 arr.unique6(); // [1, 2, 3, 4, "a", "b", 56, 32, 34, "c", 5, "1", "2"]

    同样的,类似于1'1'无法区分。所费时间:14361ms

    // 方法六
    Array.prototype.unique6 = function () {
        return this.reduce(function (newArray, index) {
            if(newArray.indexOf(index) < 0) {
                newArray.push(index);
            }
            return newArray;
        },[]);
    }

    测试结果如下:

    1 var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1','2'];
    2   arr.unique6(); // [1, 2, 3, 4, "a", "b", 56, 32, 34, "c", 5, "1", "2"]

    所费时间:16490ms

    1     // 方法七
    2 Array.prototype.unique7 = function(){
    3     var newArray;
    4     newArray = this.filter(function (ele,i,arr) {
    5         return arr.indexOf(ele) === i;
    6     });
    7     return newArray;
    8 }

    测试结果:

    1   var arr = [1,2,3,4,'a','b',1,3,4,56,32,34,2,'b','c',5,'1','2'];
    2   arr.unique6(); // [1, 2, 3, 4, "a", "b", 56, 32, 34, "c", 5, "1", "2"]

    所费时间:13201ms

    方法虽然很多种,但相比下来,下面这种方法是较为优秀的方案:

     1 Array.prototype.unique3 = function () {
     2     // 构建一个新数组存放结果
     3     var newArray = [];
     4     // 创建一个空对象
     5     var object = {};
     6     // for循环时,每次取出一个元素与对象进行对比
     7     // 如果这个元素不重复,则将它存放到结果数中
     8     // 同时把这个元素的内容作为对象的一个属性,并赋值为1,
     9     // 存入到第2步建立的对象中
    10     for (var i = 0; i < this.length; i++){
    11         // 检测在object对象中是否包含遍历到的元素的值
    12         if(!object[typeof(this[i]) + this[i]]) {
    13             // 如果不包含,将存入对象的元素的值推入到结果数组中
    14             newArray.push(this[i]);
    15             // 如果不包含,存入object对象中该属性名的值设置为1
    16             object[typeof(this[i]) + this[i]] = 1;
    17         }
    18     }
    19     return newArray;
    20 }

    但在ES6去重还有更简单,更优化的方案,比如:

    1 // ES6
    2 function unique (arr) {
    3     const seen = new Map()
    4     return arr.filter((a) => !seen.has(a) && seen.set(a, 1))
    5 }
    6 // or
    7 function unique (arr) {
    8     return Array.from(new Set(arr))
    9 }

    参考资料

  • 相关阅读:
    解决端口被占用问题
    python实现操作mysql数据库
    python实现读取并处理excel单元格中的数据
    python实现读取配置文件
    python实现读取excel
    接口测试简介
    python实现获取文件夹中的最新文件
    Redis入门
    mysql高可用研究(二) 主从+MHA+Atlas
    mysql高可用研究(一) 主从+MHA架构
  • 原文地址:https://www.cnblogs.com/jiechen/p/5521392.html
Copyright © 2020-2023  润新知