• JavaScript 运行机制


    JavaScript 运行机制

    阅读目录

    一、为什么JavaScript是单线程?

    JavaScript语言是单线程,也就是说,同一个时间只能做一件事。

    JavaScript的单线程,与它的用途有关。作为浏览器脚本语言,JavaScript的主要用途是与用户互动,以及操作DOM。这决定了它只能是单线程,否则会带来很复杂的同步问题。比如,假定JavaScript同时有两个线程,一个线程在某个DOM节点上添加内容,另一个线程删除了这个节点,这时浏览器应该以哪个线程为准?

    所以,为了避免复杂性,从一诞生,JavaScript就是单线程,这已经成了这门语言的核心特征,将来也不会改变。

    为了利用多核CPU的计算能力,HTML5提出Web Worker标准,允许JavaScript脚本创建多个线程,但是子线程完全受主线程控制,且不得操作DOM。所以,这个新标准并没有改变JavaScript单线程的本质。

     

    二、任务队列

    单线程就意味着,所有任务需要排队,前一个任务结束,才会执行后一个任务。如果前一个任务耗时很长,后一个任务就不得不一直等着。

    如果排队是因为计算量大,CPU忙不过来,倒也算了,但是很多时候CPU是闲着的,因为IO设备(输入输出设备)很慢(比如Ajax操作从网络读取数据),不得不等着结果出来,再往下执行。

    JavaScript语言的设计者意识到,这时主线程完全可以不管IO设备,挂起处于等待中的任务,先运行排在后面的任务。等到IO设备返回了结果,再回过头,把挂起的任务继续执行下去。

    于是,所有任务可以分成两种,一种是同步任务(synchronous),另一种是异步任务(asynchronous)。同步任务指的是,在主线程上排队执行的任务,只有前一个任务执行完毕,才能执行后一个任务;异步任务指的是,不进入主线程、而进入"任务队列"(task queue)的任务,只有"任务队列"通知主线程,某个异步任务可以执行了,该任务才会进入主线程执行。

    任务的执行实质上分为两步:①.执行,②.获取执行结果。  

    具体来说,异步执行的运行机制如下。(同步执行也是如此,因为它可以被视为没有任务队列的异步执行。)

    (1)所有同步任务都在主线程上执行,形成一个执行栈(execution context stack)。
    (2)主线程之外,还存在一个"任务队列"(taskqueue)。只要异步任务有了运行结果,就在"任务队列"之中放置一个相应的回调函数。
    (3)一旦"执行栈"中的所有同步任务执行完毕,系统就会读取"任务队列",看看里面有哪些事件。那些对应的异步任务,于是结束等待状态,进入执行栈,开始执行。
    (4)主线程不断重复上面的第三步。

    同步执行:执行后等待直到获取执行结果;

    异步执行:执行后不等待,而是通过一系列手段(轮询、事件监听和event loop等)获取执行结果,而在执行后和获取结果前的那段时间可以介入其他任务操作。

    三、事件和回调函数

    "任务队列"是一个事件的队列(也可以理解成消息的队列),IO设备完成一项任务,就在"任务队列"中添加一个事件,表示相关的异步任务可以进入"执行栈"了。主线程读取"任务队列",就是读取里面有哪些事件。

    "任务队列"中的事件,除了IO设备的事件以外,还包括一些用户产生的事件(比如鼠标点击、页面滚动等等)。只要指定过回调函数,这些事件发生时就会进入"任务队列",等待主线程读取。

    所谓"回调函数"(callback),就是那些会被主线程挂起来的代码。异步任务必须指定回调函数,当主线程开始执行异步任务,就是执行对应的回调函数。

    "任务队列"是一个先进先出的数据结构,排在前面的事件,优先被主线程读取。主线程的读取过程基本上是自动的,只要执行栈一清空,"任务队列"上第一位的事件就自动进入主线程。但是,由于存在后文提到的"定时器"功能,主线程首先要检查一下执行时间,某些事件只有到了规定的时间,才能返回主线程。

    异步任务补充

    onclick等:由浏览器内核的 DOM Binding 模块来处理,当事件触发的时候,回调函数会立即添加到任务队列中。
    setTimeout(setInterval):会由浏览器内核的 timer 模块来进行延时处理,当时间到达的时候,才会将回调函数添加到任务队列中。这跟之后与setImmediate执行比较有关
    ajax: 会由浏览器内核的 network 模块来处理,在网络请求完成返回之后,才将回调添加到任务队列中。

    四、Event Loop

    主线程运行的时候,产生堆(heap)和栈(stack),栈中的代码调用各种外部API,它们在"任务队列"中加入各种事件(click,load,done)。只要栈中的代码执行完毕,主线程就会去读取"任务队列",依次执行那些事件所对应的回调函数。

    执行栈中的代码(同步任务),总是在读取"任务队列"(异步任务)之前执行。请看下面这个例子。

    var req = new XMLHttpRequest();
    req.open('GET', url);
    req.onload = function (){};
    req.onerror = function (){};
    req.send();

    上面代码中的req.send方法是Ajax操作向服务器发送数据,它是一个异步任务,意味着只有当前脚本的所有代码执行完,系统才会去读取"任务队列"。所以,它与下面的写法等价。

    var req = new XMLHttpRequest();
    req.open('GET', url);
    req.send();
    req.onload = function (){};
    req.onerror = function (){};

    也就是说,指定回调函数的部分(onload和onerror),在send()方法的前面或后面无关紧要,因为它们属于执行栈的一部分,系统总是执行完它们,才会去读取"任务队列"。

    五、定时器

    除了放置异步任务的事件,"任务队列"还可以放置定时事件,即指定某些代码在多少时间之后执行。这叫做"定时器"(timer)功能,也就是定时执行的代码。

    定时器功能主要由setTimeout()和setInterval()这两个函数来完成,它们的内部运行机制完全一样,区别在于前者指定的代码是一次性执行,后者则为反复执行。以下主要讨论setTimeout()。

    setTimeout()接受两个参数,第一个是回调函数,第二个是推迟执行的毫秒数。

    console.log(1);
    setTimeout(function(){console.log(2);},1000);
    console.log(3);

    上面代码的执行结果是1,3,2;与下边的对比

    console.log(1);
    setTimeout(function(){console.log(2);},0);
    console.log(3);

    执行结果也是1,3,2。说明setTimeout()的回调函数被挂起了,当执行栈的代码执行完之后,才会执行。

    看看下边:

    console.log(1);
    setTimeout(function(){console.log(4);},0);
    setTimeout(function(){console.log(2);},100);
    console.log(3);

    执行的结果是1,3,4,2;与下边的对比

    console.log(1);
    setTimeout(function(){console.log(4);},0);
    setTimeout(function(){console.log(2);},0);
    console.log(3);

    执行的结果还是1,3,4,2。说明任务队列是按照先进先出的顺序执行的。

    HTML5标准规定了setTimeout()的第二个参数的最小值(最短间隔),不得低于4毫秒,如果低于这个值,就会自动增加。在此之前,老版本的浏览器都将最短间隔设为10毫秒。另外,对于那些DOM的变动(尤其是涉及页面重新渲染的部分),通常不会立即执行,而是每16毫秒执行一次。这时使用requestAnimationFrame()的效果要好于setTimeout()。

    需要注意的是,setTimeout()只是将事件插入了"任务队列",必须等到当前代码(执行栈)执行完,主线程才会去执行它指定的回调函数。要是当前代码耗时很长,有可能要等很久,所以并没有办法保证,回调函数一定会在setTimeout()指定的时间执行。请看下面这个例子。

    var startTime = new Date();
    console.log(new Date().getTime());
    setTimeout(function () {
        console.log(new Date().getTime());
        console.log(new Date() - startTime)
    },100)

    执行结果是:

    1498962204851
    1498962204959
    160

    六、Node.js的Event Loop

    Node.js也是单线程的Event Loop,但是它的运行机制不同于浏览器环境。

    请看下面的示意图(作者@BusyRich)。

    根据上图,Node.js的运行机制如下。

    (1)V8引擎解析JavaScript脚本。
    (2)解析后的代码,调用Node API。
    (3)libuv库负责Node
    API的执行。它将不同的任务分配给不同的线程,形成一个Event Loop(事件循环),以异步的方式将任务的执行结果返回给V8引擎。
    (4)V8引擎再将结果返回给用户。

    除了setTimeout和setInterval这两个方法,Node.js还提供了另外两个与"任务队列"有关的方法:process.nextTicksetImmediate。它们可以帮助我们加深对"任务队列"的理解。

    process.nextTick方法可以在当前"执行栈"的尾部触发回调函数。也就是说,它指定的任务总是在当前执行栈清空之后执行。setImmediate方法则是在当前"任务队列"的尾部添加事件,也就是说,它指定的任务总是在下一次Event Loop时执行,这与setTimeout(fn, 0)很像。请看下面的例子(via StackOverflow)。

    process.nextTick(function A() {
      console.log(1);
      process.nextTick(function B(){console.log(2);});
    });
    setTimeout(function timeout() {
      console.log('TIMEOUT FIRED');
    }, 0)

    执行结果:

    1
    2
    TIMEOUT FIRED

    上面代码中,由于process.nextTick方法指定的回调函数,总是在当前"执行栈"的尾部触发,所以不仅函数A比setTimeout指定的回调函数timeout先执行,而且函数B也比timeout先执行。这说明,如果有多个process.nextTick语句(不管它们是否嵌套),将全部在当前"执行栈"执行。

    现在,再看setImmediate。

    setImmediate(function A() {
      console.log(1);
      setImmediate(function B(){console.log(2);});
    });
    setTimeout(function timeout() {
      console.log('TIMEOUT FIRED');
    }, 0);

    多次执行结果(T.T修改):

    TIMEOUT FIRED
    1
    2

    与下边的对比:

    setTimeout(function timeout() {
        console.log('TIMEOUT FIRED');
    }, 10);

    多次执行结果:

    1
    TIMEOUT FIRED
    2

    再与下边的对比:

    setTimeout(function timeout() {
        console.log('TIMEOUT FIRED');
    }, 1000);

    多次执行结果:

    1
    2
    TIMEOUT FIRED

    好像跟说的对不上。但是想想又对。结合这句话setTimeout再来看。

    (T.T添加)setTimeout和setInterval的运行机制是,将指定的代码移出本次执行,等到下一轮Event Loop前,再检查是否到了指定时间。如果到了,就执行对应的代码;如果不到,就等到再下一轮Event Loop时重新判断。这意味着,setTimeout指定的代码,必须等到本次执行的所有代码都执行完,才会执行。

    (T.T添加)每一轮Event Loop时,都会将“任务队列”中需要执行的任务,一次执行完。setTimeout和setInterval都是把任务添加到“任务队列”的尾部。因 此,它们实际上要等到当前脚本的所有同步任务执行完,然后再等到本次Event Loop的“任务队列”的所有任务执行完,才会开始执行。由于前面的任务到底需要多少时间执行完,是不确定的,所以没有办法保证,setTimeout和 setInterval指定的任务,一定会按照预定时间执行。

    (T.T添加)分析一下,timeout的执行先后跟着延时改变,

    • 延时为0,第一执行,检测到时机已到,直接执行;setImmediate要检查栈是否清空,就比timeout慢了一拍
    • 延时为10,第二执行,第一次完成检查栈是否清空时,时间还不到10ms,然后执行输出了1,第二次完成检查栈是否清空,时间就已经超过10ms,即先timeout输出,然后2
    • 延时为100,第三执行,两次完成检查是否清空栈都在100ms之前,先输出1,2,在执行timeout

    测试setImmediate检查延时一次约1ms--2ms。

    由于setTimeout存在时间精度,因此setTimeout(handler,0)中setTimeout事件插入事件队列的延时必定大于0ms,而handler的执行延时则更大了。具体为IE5~8和不插电源的IE9的时间精度为15.6ms,插电源的IE9和其他浏览器则为4ms。跟(五、定时器)的说法一致

    七、关于setTimeout的测试

    for (var i = 0; i < 5; i++) {
      console.log(i);
    }
    for (var i = 0; i < 5; i++) {
      setTimeout(function() {
        console.log(i);
      }, 1000 * i);
    }
    for (var i = 0; i < 5; i++) {
      (function(i) {
        setTimeout(function() {
          console.log(i);
        }, i * 1000);
      })(i);
    }
    for (var i = 0; i < 5; i++) {
      (function() {
        setTimeout(function() {
          console.log(i);
        }, i * 1000);
      })(i);
    }
    for (var i = 0; i < 5; i++) {
      setTimeout((function(i) {
        console.log(i);
      })(i), i * 1000);
    }
    setTimeout(function() {
      console.log(1)
    }, 0);
    new Promise(function executor(resolve) {
      console.log(2);
      for( var i=0 ; i<10000 ; i++ ) {
        i == 9999 && resolve();
      }
      console.log(3);
    }).then(function() {
      console.log(4);
    });
    console.log(5);

    要多思考,不记录了。

    少原创,看了很多文章,写了一遍之后还是有疑问就又查了资料来补充。上文有什么感觉不对的欢迎指出。感谢。

    10.31补:每次回顾这篇文章,也会有一些理解偏差的,甚至是错误的地方,所以,多看看,多考证吧;

    参考文章:

  • 相关阅读:
    linux就该这么学.pdf
    linux中shell编辑小技巧
    相关功能分享
    现代操作系统第三版高清.pdf中文版免费下载
    linux高性能服务器编程pdf免费下载
    git每次更新都需要输入账号密码,如何解决?
    Python 面向对象
    模块和包
    Python常用模块(collections、 time、 random、 os 、sys、序列化模块)
    内置函数和匿名函数(lambda)
  • 原文地址:https://www.cnblogs.com/Merrys/p/7105511.html
Copyright © 2020-2023  润新知