加入收藏 | 设为首页 | 会员中心 | 我要投稿 平顶山站长网 (https://www.0375zz.cn/)- 分布式云、数据处理、媒体处理、图像分析、基础存储!
当前位置: 首页 > 综合聚焦 > 编程要点 > 语言 > 正文

javascript并发控制是什么意思?怎样写并发控制?

发布时间:2022-03-24 14:19:32 所属栏目:语言 来源:互联网
导读:并发控制是确保及时纠正由并发操作导致的错误的一种机制。我们在开发过程中,有时会遇到需要控制任务并发执行数量的需求。那么就需要做并发控制。例如一个爬虫程序,可以通过限制其并发任务数量来降低请求频率,从而避免由于请求过于频繁被封禁问题的发生。
       并发控制是确保及时纠正由并发操作导致的错误的一种机制。我们在开发过程中,有时会遇到需要控制任务并发执行数量的需求。那么就需要做并发控制。例如一个爬虫程序,可以通过限制其并发任务数量来降低请求频率,从而避免由于请求过于频繁被封禁问题的发生。关于并发控制大家都了解了,下面我们就来说说JavaScript怎样实现并发控制?
 
       示例
const task = timeout => new Promise((resolve) => setTimeout(() => {
  resolve(timeout);
 }, timeout))
 
 const taskList = [1000, 3000, 200, 1300, 800, 2000];
 
 async function startNoConcurrentControl() {
  console.time(NO_CONCURRENT_CONTROL_LOG);
  await Promise.all(taskList.map(item => task(item)));
  console.timeEnd(NO_CONCURRENT_CONTROL_LOG);
 }
 
 startNoConcurrentControl();
  上述示例代码利用 Promise.all 方法模拟6个任务并发执行的场景,执行完所有任务的总耗时为 3000 毫秒。下面会采用该示例来验证实现方法的正确性。
 
       实现
  由于任务并发执行的数量是有限的,那么就需要一种数据结构来管理不断产生的任务。队列的「先进先出」特性可以保证任务并发执行的顺序,在 JavaScript 中可以通过「数组来模拟队列」:
 
class Queue {
  constructor() {
   this._queue = [];
  }
 
  push(value) {
   return this._queue.push(value);
  }
 
  shift() {
   return this._queue.shift();
  }
 
  isEmpty() {
   return this._queue.length === 0;
  }
 }
  对于每一个任务,需要管理其执行函数和参数:
 
class DelayedTask {
  constructor(resolve, fn, args) {
   this.resolve = resolve;
   this.fn = fn;
   this.args = args;
  }
 }
  接下来实现核心的 TaskPool 类,该类主要用来控制任务的执行:
 
class TaskPool {
  constructor(size) {
   this.size = size;
   this.queue = new Queue();
  }
 
  addTask(fn, args) {
   return new Promise((resolve) => {
    this.queue.push(new DelayedTask(resolve, fn, args));
    if (this.size) {
     this.size--;
     const { resolve: taskResole, fn, args } = this.queue.shift();
     taskResole(this.runTask(fn, args));
    }
   })
  }
 
  pullTask() {
   if (this.queue.isEmpty()) {
    return;
   }
 
   if (this.size === 0) {
    return;
   }
 
   this.size++;
   const { resolve, fn, args } = this.queue.shift();
   resolve(this.runTask(fn, args));
  }
 
  runTask(fn, args) {
   const result = Promise.resolve(fn(...args));
 
   result.then(() => {
    this.size--;
    this.pullTask();
   }).catch(() => {
    this.size--;
    this.pullTask();
   })
 
   return result;
  }
 }
       TaskPool 包含三个关键方法:
 
addTask: 将新的任务放入队列当中,并触发任务池状态检测,如果当前任务池非满载状态,则从队列中取出任务放入任务池中执行。
runTask: 执行当前任务,任务执行完成之后,更新任务池状态,此时触发主动拉取新任务的机制。
pullTask: 如果当前队列不为空,且任务池不满载,则主动取出队列中的任务执行。
 
 
  接下来,将前面示例的并发数控制为2个:
 
 const cc = new ConcurrentControl(2);
 
 async function startConcurrentControl() {
  console.time(CONCURRENT_CONTROL_LOG);
  await Promise.all(taskList.map(item => cc.addTask(task, [item])))
  console.timeEnd(CONCURRENT_CONTROL_LOG);
 }
 
 startConcurrentControl();
  执行流程如下:
 
 
 
  最终执行任务的总耗时为 5000 毫秒。
 
       高阶函数优化参数传递
await Promise.all(taskList.map(item => cc.addTask(task, [item])))
  手动传递每个任务的参数的方式显得非常繁琐,这里可以通过「高阶函数实现参数的自动透传」:
 
addTask(fn) {
  return (...args) => {
   return new Promise((resolve) => {
    this.queue.push(new DelayedTask(resolve, fn, args));
 
    if (this.size) {
     this.size--;
     const { resolve: taskResole, fn: taskFn, args: taskArgs } = this.queue.shift();
     taskResole(this.runTask(taskFn, taskArgs));
    }
   })
  }
 }
       改造之后的代码显得简洁了很多:
 
 await Promise.all(taskList.map(cc.addTask(task)))
       优化出队操作
  数组一般都是基于一块「连续内存」来存储,当调用数组的 shift 方法时,首先是删除头部元素(时间复杂度 O(1)),然后需要将未删除元素左移一位(时间复杂度 O(n)),所以 shift 操作的时间复杂度为 O(n)。
 
 
 
  由于 JavaScript 语言的特性,V8 在实现 JSArray 的时候给出了一种空间和时间权衡的解决方案,在不同的场景下,JSArray 会在 FixedArray 和 HashTable 两种模式间切换。
 
  在 hashTable 模式下,shift 操作省去了左移的时间复杂度,其时间复杂度可以降低为 O(1),即使如此,shift 仍然是一个耗时的操作。
 
  在数组元素比较多且需要频繁执行 shift 操作的场景下,可以通过「reverse + pop」的方式优化。
 
const Benchmark = require('benchmark');
 const suite = new Benchmark.Suite;
 
 suite.add('shift', function() {
  let count = 10;
  const arr = generateArray(count);
  while (count--) {
   arr.shift();
  }
 })
 .add('reverse + pop', function() {
  let count = 10;
  const arr = generateArray(count);
  arr.reverse();
  while (count--) {
   arr.pop();
  }
 })
 .on('cycle', function(event) {
  console.log(String(event.target));
 })
 .on('complete', function() {
  console.log('Fastest is ' + this.filter('fastest').map('name'));
  console.log('n')
 })
 .run({
  async: true
 })
       通过 benchmark.js 跑出的基准测试数据,可以很容易地看出哪种方式的效率更高:
 
 
 
  回顾之前 Queue 类的实现,由于只有一个数组来存储任务,直接使用 reverse + pop 的方式,必然会影响任务执行的次序。这里就需要引入双数组的设计,一个数组负责入队操作,一个数组负责出队操作。
 
 class HighPerformanceQueue {
  constructor() {
   this.q1 = []; // 用于 push 数据
   this.q2 = []; // 用于 shift 数据
  }
 
  push(value) {
   return this.q1.push(value);
  }
 
  shift() {
   let q2 = this.q2;
   if (q2.length === 0) {
    const q1 = this.q1;
    if (q1.length === 0) {
     return;
    }
    q2 = this.q2 = q1.reverse();
   }
 
   return q2.pop();
  }
 
  isEmpty() {
   if (this.q1.length === 0 && this.q2.length === 0) {
    return true;
   }
   return false;
  }
 }

(编辑:平顶山站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读