此作业的要求参见[https://edu.cnblogs.com/campus/nenu/2020Fall/homework/11207]
白名单 SPEC
老杨因为留作业太多被学生投诉下岗了,去面试,刚好你是公司的面试官。出了道题,题目要求如下(别忙着答题,现在是背景,作业的要求还在后面)。
1) 程序名brute,按照下面的要求读入两个文件。文件 whitelist,包含1列整数10个,随机生成(要求老杨自己想办法),通过命令行参数指出文件名。文件 q,包含1列整数1000个,随机生成(也要求老杨自己想办法),通过控制台读入。
2) 在文件q中查找所有不在whitelist中的整数,定向输出到一个文件中。(读到此处,你见老杨面露困惑,出于多年,不,一年,不,半年的师生情谊,你补充道,“杨老师,您就当这是从交易记录q中查找不符合白名单whitelist的非法交易。”老杨感激地点点头。)
3) 写一份如何部署运行代码的readme。
作业0(5分)
修改create.cpp文件,改成由命令行参数确定生成的数据的数据量。修改readme.md的对应部分。(要求贴出修改之后的代码和read.md。)
修改后代码如下:
#include <iostream>
#include <stdlib.h>
#include <time.h>
using namespace std;
int main(int argc, char* argv[])
{
srand((unsigned)time(NULL));
int a;
sscanf(argv[1],"%d",&a);
for(int i=0; i<a;i++)
{
cout << rand() << "
";
}
cout << endl;
return 0;
}
修改readme.md文件
作业1(10分)
对上面两段老杨写的代码任选其一进行profile,观察现象(要求有截图记录)。
我选择的是第一个代码进行profile,使用的是vs2019,
截图如下:
由图可以看出,外部代码执行的最慢,因为运行时他站的百分比最大。
你是一个好人,为了让老杨知道为什么要对代码进行profile,于是你在原来的题目的基础上做出了修改,修改之后的题要求如下:
1) 读入两个文件,一个用控制台,一个用命令行参数指出文件名。
文件 biggerwhitelist,包含1列整数1M个,随机生成(要求老杨自己想办法),通过命令行参数指出文件名。
文件 biggerq,包含1列整数10M个,随机生成(也要求老杨自己想办法),通过控制台读入。
2) 在文件biggerq中查找所有不在biggerwhitelist中的整数,重定向输出到一个文件中。
3) 写一份如何部署运行代码的readme。
作业2(10分)
以biggerwhitelist和biggerq作为输入,对作业1中选择的代码再次进行profile,找到代码执行最“慢”的地方,截图为证并文字说明。
由图可以看出,红色的代码块即为执行慢的地方,颜色越深,代表执行的越慢。所以说是is_match()函数效率比较低,所以要对is_match()函数进行优化。
老杨再次profile之后发现了代码最慢的地方在哪儿。这时候你说:“既然找到了最慢的地方,那就开始对你的代码进行优化吧。”对于这次引导的结果,你很得意。
作业3(10分)
根据作业2找到的最慢的地方,优化作业1中你选择的代码,在保证输出结果正确的前提下,减少老杨程序运行的时间。(优化后的代码需要你提交到git上,作为教师的判断依据。优化后的程序的名字应该是better.cpp或者better.cs。)
代码:
#include <algorithm>
#include <fstream>
#include <iostream>
#include <cstring>
#include <cstdio>
using namespace std;
const int w_1m = 1000000;
int w[w_1m];
int binarySearch(int t, int low, int high)
{
//对排序后的有序数据进行二分查找
while (low <= high)
{
int mid = low + (high - low) / 2;
if (t < w[mid])high = mid - 1;
else if (t > w[mid])low = mid + 1;
else return mid;
}
return -1;
}
// brute -w whitelist < T
int main(int argc, char* argv[])
{
if (argc != 3 || strcmp(argv[1], "-w"))
{
return 1;
}
// init w
//// for(int i=0;i<w_1m)
//// {
//// w[i]=-1; //填充非法数据
//// }
ifstream infile;
infile.open(argv[2]);
int i = 0;
cout << argv[2] << endl;
while (infile >> w[i++])
{
}
int w_length = i - 1;
cout << w_length << endl;
// check t
int t = 0;
sort(w, w + w_length);
//对w中的数据进行排序
while (cin >> t)
{
if (binarySearch(t, 0, w_length) != -1)
{
printf("%d", t);
}
}
}
git地址:https://github.com/hhwwxx11/better
老杨在优化了代码之后,发现果然代码运行“快”了很多,很是得意。这时候你想“好人”做到底,顺水推舟一把。你说:“对优化后的代码再profile一下吧。”老杨与你意见一致。
作业4(5分)
对作业3优化后的代码进行profile,结果与作业2的结果做对比。画表格并文字说明。
优化后的执行效果截图:
很明显可以看出,优化之后颜色变浅了,运行时间也缩短了。
最后,老杨发现了他原本代码的不足,并且对于你的引导表达了谢意。
但是,你还是犹豫要不要录用老杨。因为你觉得老杨的文档(readme),注释和代码风格有很大的问题,并且给老杨指了出来。
作业5(5分)
你觉得老杨的文档(readme),注释和代码风格又哪些问题,该如何改进?
(1)代码注释比较混乱,有的是//,有的是////。
(2)每一个函数都应标明各自的作用,这样会让读者对程序有更好的理解。
(3)应该把没用的代码删除
(4)注释尽量用中文来说明
面试结束了,你和老杨握手,对他说出了面试的结果。你说的内容,不是今天的作业题,也许是若干年以后你想对当年教你的教师说的,也许是你希望未来的面试官对你说的。你想说的是什么呢?
以后还是要注意一下优化问题,会节省很多运行时间,继续加油!