RGB2GRAY 各种算法速度比较，整形乘法比查表法快！

1. 查表法，外循环用这种格式： //for(int j = 0; j != h; ++j)// for(int i = 0; i!=w;++i)//、

		for(int j = 0; j != h; ++j)
			for(int i = 0; i!=w;++i)
		{
			int r,g,b,y,r1,g1,b1,y1;
			r = D[in[of3]];//查表 //这里给第一个ALU执行
			g = E[in[of3+1]];
			b = F[in[of3+2]];
			y = r + g + b;
			out[of] = y;
			of3 +=3;
			of+=1;
		}

耗时： 1000ms

2. 查表法，外循环用这种格式： for(int i = 0; i != img_size; ++i)

		for(int i = 0; i != img_size; ++i)
		{
			int r,g,b,y,r1,g1,b1,y1;
			r = D[in[of3+2]];//查表 //这里给第一个ALU执行
			g = E[in[of3+1]];
			b = F[in[of3]];
			y = r + g + b;
			out[i] = y;
			of3 +=3;
		}

耗时 700ms

3. 整形乘法， 1ALU

		for(int i = 0; i != img_size; ++i)
		{
			int r,g,b,y,r1,g1,b1,y1;
			r = 1224 * in[of3+2];
			g = 2404 * in[of3+1];
			b = 467 * in[of3];
			y = r + g + b;
			y = y >> 12; //这里去掉了除法运算
			out[i] = y;
			of3 +=3;
		}

耗时： 550ms

4. 整形乘法： 2ALU

		for(int i = 0; i != img_size; i+=2) //一次并行处理2个数据
		{

			int r,g,b,y,r1,g1,b1,y1;

			r = 1224 * in[of6+2];
			g = 2404 * in[of6+1];
			b = 467 * in[of6];
			y = r + g + b;
			y = y >> 12;
			out[i] = y;

			r1 = 1224 * in[of6+5];
			g1 = 2404 * in[of6+4];
			b1 = 467 * in[of6+3];
			y = r1 + g1 + b1;
			y = y >> 12;
			out[i + 1] = y;
			of6 += 6;
			//of  += 1;
		}

耗时：450ms

5. 根据实验，发现bgr2y 函数是否加inline 对耗时无明显影响，为了保险，还是应该加上inline。

思考：

1. 2ALU算法比1ALU算法快10%~25%

2.整形乘法法比查表法快 18%，至于为什么会比查表法快，是因为现在的CPU使用的都是硬件乘法器，比操作内存要快！！

相关阅读:
Populating Next Right Pointers in Each Node
Reverse Linked List
Reverse Linked List II
Triangle
Surrounded Regions
Effective_STL 学习笔记（十九）了解相等和等价的区别
Effective_STL 学习笔记（十八）避免使用 vector<bool>
Effective_STL 学习笔记（十七）使用 “交换技巧” 来修整过剩的容量
Effective_C++ （条款02）尽量以 const，enum，inline替换 #define
Effective_C++ （条款01）视 C++ 为一个语言联邦

原文地址：https://www.cnblogs.com/luoyinjie/p/7219310.html