第六次作业--结对编程第二次

结对情况

自己
- 学号后三位：612
- 名：章鹏
**队友 **
- 学号后三位：621
- 少
- 博客链接

项目链接

设计说明

接口设计（API)

读取json文件中的学生信息，需要传递三个参数：student类指针，学生数量，部门数量

toStudent(student*, int,int)

读取json文件中的部门信息，需要传递三个参数：department类指针，学生数量，部门数量

toDepartment(department*, int, int)

将结果输出到json文件，需要传递6个参数：list指针，list指针，student类指针，department类指针，学生数量，部门数量

void write(list<int>* , list<int>* , student* , department* ,int, int )

内部实现设计（类图）

创建student和department类，通过read读取json数据给student对象department对象，通过matched进行匹配，通过write将结果输出为json格式。

匹配算法设计（思想/流程等）

通过权值来衡量部门和学生的之间的匹配程度，对于匹配程度高的，优先加入此部门，权值计算方法如下：

对于第x个部门，分析学生的四个方面的信息

分析学生部门意愿，是否包含此部门
分析学生兴趣标签，与部门所希望学生拥有的兴趣标签的吻合度
分析学生有空时间，与部门常规活动安排表的吻合度
分析学生绩点

对于上面四个方面设置对应的权值

部门意愿占7分，若学生部门意愿含有此部门则拿到此7分。
兴趣标签占2分，学生的兴趣标签与部门所希望学生拥有的兴趣标签的吻合度越高，拿到的分数越多（最多两分）。
有空时间占2分，学生的有空时间与部门常规活动安排表的吻合度越高，拿到的分数越多（最多两分）。
学生绩点占2份，学生的绩点越高，拿到的分数越多（最多两分）。

权值计算方法如下

权值 = 7（学生意愿此部门）＋（兴趣匹配数量 / 部门标签数量）* 2 + 时间匹配数量 / 部门活动时间数量 * 2 + （绩点 / 5 ）* 2

对于每个部门，将所有学生的分数从高到低排序，其中分数小于7的（即部门意愿不包含第x个部门）的学生不作为部门挑选成员对象，由部门根据分数高低顺序挑选学生，直到挑选到的人数等于部门纳新限制人数时，结束挑选。

测试数据生成

测试时部门与学生之间的匹配算法时，需要使用大量的json格式的部门和学生的数据。
通过人工编辑这些数据不可行，需要计算机程序生成。利用rapidjson中writer接口和随机数生成函数，随机生成测试数据并以json格式保存。部分代码如下：

		Value object(kObjectType);
		//设置学号
		object.AddMember("student_no", student_no, allocator);
		//设置学生姓名
		object.AddMember("student_name", Value(student_name.c_str(), document.GetAllocator()).Move(), allocator);
		//设置学分
		object.AddMember("score", score, allocator);
		//添加兴趣
		randArray(tag_count, 10, arra);//生成随机数数组
		Value array4(kArrayType);
		for (int i = 0; i < tag_count; i++)
		{
			array4.PushBack(Value(tag_hub[arra[i]].c_str(), document.GetAllocator()).Move(), allocator);//将兴趣写入json数组
		}
		object.AddMember("tags", array4, allocator);

上述代码为创建一个学生对象的部分代码，展示了如何将随机生成的数据添加进json对象。Value object（）为创建一个json对象，Value array()创建一个json数组，object.AddMember（）为对象增加成员。利用生成随机姓名字符串，赋值给“student_name"。为了避免生成的随机数的重复，生成随机数数组，利用其将兴趣字符串数组tag_hub[]中的值随机写入json数组，通过这种方法完成实验数据的随机生成。

评价自己的匹配算法

优点：

保证部门纳新到的学生，都是想加入此部门的（意愿表中含有此部门）。
采用计算每个学生四个信息与部门的要求的吻合程度，来供部门挑选，比较合理。
可以通过修改绩点、标签等的权值比重，来灵活挑选学生。

缺点：

由于部门意愿占分数的比例大，加上部门人数有限制，会出现大量学生没有加入部门。
需要双重循环每个部门和每个学生，比较耗时。

代码规范要求

规范	要求	备注
变量、函数命名	使用驼峰命名法	如：FirstName
空格、缩进使用	使用4个空格来缩进代码	不使用TAB来缩进
注释使用	标注函数功能，标注变量、复杂的过程	尽量详细
类命名	首字母大写
语句规则	通常运算符前后加空格	如：i = j + k;
其他	每行代码字符数小于80个

关键代码解释

对于第i个部门，第j个学生，关于匹配算法四个信息与部门要求的吻合度的计算：

判断学生是否愿意加入此部门，如果愿意，权值加7，代码如下：

			/*根据学生选择部门的意愿计算权值	*/
			for (m = 0; m < sw; m++)
			{	//循环第j个学生的意愿数组
				if (*(stu[j].getDep_will() + m) == dep[i].getDep_no())
				{
					q += 7;						//计算权值（累加）
					break;
				}
			}

计算绩点的权值，代码如下：

			/*根据学生的绩点来计算权值*/
			q += (stu[j].getScore() / 5.0) * 2;

通过计算学生空闲时间与部门活动时间的吻合程度计算权值，代码如下：

			/*根据学生的空闲时间段和部门活动时间段来计算权值*/
			//timeConvert()将用字符串表示的时间转换成用stime类表示
			temp = 0;
			for (m = 0; m < da; m++)
			{	/*对于每个部门的时间段循环学生有空时间数组*/
				for (n = 0; n < sa; n++)
				{
					if (stuTime[n].week != depTime[m].week)  continue;
					if (stuTime[n].start > depTime[m].start)	continue;
					if (stuTime[n].end < depTime[m].end)	continue;
					temp++;
					break;
				}
			}
			q += temp*1.0 / da * 2;			//计算权值（累加）

通过计算学生兴趣与部门标签的吻合程度计算权值，代码如下：

			/*根据学生的兴趣爱好和部门想要的兴趣tags来计算权值*/
			temp = 0;
			for (m = 0; m < dt; m++)
			{
				/*对于每个部门的兴趣要求段循环学生的兴趣*/
				for (n = 0; n < st; n++)
				{
					if (*(stu[j].getTags() + n) != *(dep[i].getTags() + m)) continue;
					temp++;
					break;
				}
			}
			q += temp*1.0 / dt * 2;			//计算权值（累加）

将所有学生对某个部门按权值从大到小排序，权值小于7不加入排序，代码如下：

			/*将第x个学生计算后的权值保存在stu_dep[x]中*/
			stu_dep[j] = q;
			/*将学生的权值进行排序，权值大的学生的下标，优先排在数组stu_dep_sort的前面*/
			if (q < 7)continue;					//权值小于7，无需记录此学生
			stu_dep_sort[k] = j;
			for (n = k - 1; n > -1; n--)
			{
				if (stu_dep[stu_dep_sort[n + 1]] > stu_dep[stu_dep_sort[n]])
				{
					temp = stu_dep_sort[n + 1];
					stu_dep_sort[n + 1] = stu_dep_sort[n];
					stu_dep_sort[n] = temp;
				}
			}
			k++;

运行及测试结果展示

测试200位同学，20个部门的情况

输入数据片段展示及完整数据链接
- 输入数据
输除数据片段展示及完整数据链接
- 输出数据

测试500位同学，30个部门的情况

输入数据片段展示及完整数据链接
- 输入数据
输除数据片段展示及完整数据链接
- 输出数据

测试1000位同学，50个部门的情况

输入数据片段展示及完整数据链接
- 输入数据
输除数据片段展示及完整数据链接
- 输出数据

测试5000位同学，100个部门的情况

输入数据片段展示及完整数据链接
- 输入数据
输除数据片段展示及完整数据链接
- 输出数据

效能分析报告

从下图可以看出，读json文件花费时间最多，非独占时间占用了72.05%；其次是匹配算法，非独占时间占用了13.14%，写json非独占时间占用了3.50%。可以从读json文件和匹配算法方面考虑优化程序。

遇到的困难及解决方法

遇到的困难
- 第一次接触JSON格式文件，对其不了解，解析和生成JSON格式的学生和部门信息遇到困难。
- 接口的概念理解不够深刻，输入输出的接口设计遇到问题。
- 对于代码规范缺乏经验。
做过的尝试
- 搜索JSON文件的相关文档，理解其格式与结构。查找现在主流的解析及生成JSON的C++库,并学习其使用方法。
- 搜寻相关代码，参考别人的设计方式。
- 查阅主流的代码规范，并针对自己的项目，作出适当修改。
是否解决
根据实际情况，我们选择使用rapidjson对JSON文件进行解析和生成，通过阅读官方的文档和参考现有的代码，成功得解决了相关问题。但是对于接口的设计，仍然很困惑。不懂得如何设计，能够为该匹配程序模块后期可能的整合入系统提供便利。至于代码规范，参考了很多文档，找到了最适合我们的规范。
收获
- 熟悉了json格式的文件。本次作业中，大量练习了使用rapidjson解析和生成json文件，比如随机生成大量规定的学生和部门信息并读取，基本掌握了该文件的使用方法。
- 首次设计了代码规范。
- 了解了接口的使用。
- 算得上是第一次真正意义上的结对编程。

PSP表格

PSP2.1	Personal Software Process Stages	预估耗时（分钟）	实际耗时（分钟）
Planning	计划	30	40
· Estimate	· 估计这个任务需要多少时间	20	10
Development	开发	200	150
· Analysis	· 需求分析 (包括学习新技术)	40	30
· Design Spec	· 生成设计文档	30	40
· Design Review	· 设计复审 (和同事审核设计文档)	30	20
· Coding Standard	· 代码规范 (为目前的开发制定合适的规范)	20	20
· Design	· 具体设计	30	30
· Coding	· 具体编码	200	300
· Code Review	· 代码复审	60	50
· Test	· 测试（自我测试，修改代码，提交修改）	40	60
Reporting	报告	20	20
· Test Report	· 测试报告	30	40
· Size Measurement	· 计算工作量	15	20
· Postmortem & Process Improvement Plan	· 事后总结, 并提出过程改进计划	30	30
合计		795	860

学习进度条

第N周	新增代码（行）	累计代码（行）	本周学习耗时(小时)	累计学习耗时（小时）	重要成长
1	300	300	5	5	主要写了数独代码熟悉了算法，学习javascript语法
2	70	370	6	11	继续习javascript语法、熟悉了原型设计，用到工具Axure RP，学习了NABCD
3	200	570	8	19	学习php
5	500	1070	14	33	了解json，完成结对作业

相关阅读:
Python pandas 入门 05 JSON
Python matplotlib 画图入门 07 散点图
 Python matplotlib 画图入门 06 绘制多图
 Python pandas 入门 04 CSV 文件
 Python pandas 入门 01 安装
 Python 入门示例系列 35 迭代器与生成器
 Python matplotlib 画图入门 03 绘图线
 Python pandas 入门目录
 Python 零散知识点琐碎知识
 Python numpy 入门系列目录
原文地址：https://www.cnblogs.com/pengpeng123/p/7674023.html