结对项目--计算最长单词链

项目	内容
这个作业属于哪个课程	2019春季计算机学院软件工程(罗杰)
这个作业的要求在哪里	作业要求
我在这个课程的目标是	完成结对编程
这个作业在哪个具体方面帮助我实现目标	为团队合作打基础

Github地址
PSP预估时间
接口设计原则
Core的接口设计和实现过程
UML图
计算模块接口部分的性能改进
Design by Contract, Code Contract
计算模块部分单元测试展示
计算模块异常处理说明
界面模块的详细设计过程
界面模块与计算模块的对接
结对编程
与其他小组的松耦合测试
PSP表格实际消耗

Github地址

https://github.com/zackertypical/WordChain

PSP预估时间

PSP2.1	Personal Software Process Stages	预估耗时（分钟）
Planning	计划	60
·Estimate	估计这个任务需要多少时间	60
Development	开发	57*60
·Analysis	·需求分析 (包括学习新技术)	8*60
·Design Spec	· 生成设计文档	4*60
·Design Review	· 设计复审 (和同事审核设计文档)	2*60
·Coding Standard	· 代码规范 (为目前的开发制定合适的规范)	1*60
·Design	· 具体设计	5*60
·Coding	· 具体编码	24*60
·Code Review	· 代码复审	8*60
·Test	· 测试（自我测试，修改代码，提交修改）	5*60
Reporting	报告	5*60
·Test Report	· 测试报告	2*60
·Size Measurement	· 计算工作量	60
·ostmortem & Process Improvement Plan	· 事后总结, 并提出过程改进计划	2*60
	合计	63*60

接口设计原则

Information Hiding

为了实现良好的封装，需要从两个方面考虑：

1、将对象的属性和实现细节隐藏起来，不允许外部直接访问。让使用者只能通过事先预定好的方法来访问数据，从而可以在该方法里加入控制逻辑，限制对属性的不合理访问。

2、把方法暴漏出去，让方法来操作或访问这些属性。

我们在设计DFS图的类时，所有数据成员都无法被外部直接访问，例如图的权重数组，邻接表数组，通过外部的接口对图中节点进行权重的修改，进行边的插入的操作，实现了信息的隐藏。

在计算最长路径的时候，也仅提供了输出的接口，无法对图的私有成员进行操作，所有计算过程在类里私有函数完成，外部仅访问得到结果的接口。

Interface Design

将需求抽象成一个个独立的接口/抽象类，然后被继承或委托/组成的形式来实现或拓展新的具体或更加强大完善的抽象，通过层层封装、继承，最后就会实现运行时多态的特性，从而提高代码的灵活性。

良好的接口需要有单一职责性和可拓展性。在本次项目中，我们利用继承与多态的思想，建立了一个图的基类，其他类都实现这个基类提供的方法，例如修改结点权值，插入边等操作，对于结果的读取，实现findAns()函数，但不同的类该接口的实现方法不一样。

比如有首尾字母约束的类，实现同样的findAns()接口，无论是怎样的参数组合，最终都要通过这个接口来访问结果。这样降低的模块之间的耦合度，提高了代码复用，提高了模块的单一性。

同时Core计算模块也实现了对外的接口，需要传入word还有一些参数，返回result结果，降低了耦合性。

Loose Coupling

软件工程中对象之间的耦合度就是对象之间的依赖性。对象之间的耦合越高，维护成本越高。因此对象的设计应使类和构件之间的耦合最小。

对于不同的参数类型，我们构建了继承于基类的子类，例如实现约束首字母的类，需要单独有数组来存单词是否符合首字母约束，而约束尾字母也可以用该类进行计算，只需要在结果输出以后把数组反转即可。

对于首尾字母都有约束的情况也单独有一个子类来完成功能，继承自只有首字母约束的类。

在图内实现dfs，判断是否有环，最终输出结果都是单独实现的函数，每个方法完成一个功能，降低了函数之间的耦合性。

Core的接口设计和实现过程

1、代码组织：

类的设计

1、接口

需要对传入的参数进行解析，实例化Core核心计算类和DFS图，经计算后返回结果

2、core类

通过core接口对图进行操作。关键函数如下：
- void insertChain(char * words[], int len);
  进行单词链的去重操作和排序。
- void setHeadTail(DFSHeadTailGraph &graph, char tail);
  对图的数组进行操作，指定头尾节点的约束。
- void insert_weighedEdge(DFSGraph &graph);
  对图的边进行插入操作，赋予边权重。
- void getresult(char *result[], vector& ans);
  通过图内部函数的计算得到结果。
3、图类

对建好的图进行dfs计算出最终的结果链，由core打印结果，本身不存储单词信息，只存储节点的编号。

关键函数如下：

** 私有函数 **
void findAnsChain();
调用dfs进行最长链的寻找，把结果保存在私有变量vector ans中。
int dfs(int index);
对有环图的dfs。
int dpDfs(int index);
对无环图的dfs。

** 公有函数 **
void insertEdge(int i, int j);
对图进行边的插入。
void changeVecWeigh(int i, int weight);
改变图的节点权重。
const vector& getAnsChain();
外部访问得到最长链的节点编号数组。
bool hasCircle();
外部进行访问，可以得到图是否有环的信息。

4、Exception类

对各种异常进行处理，包括参数异常，对图的操作异常等。

5、命令行输入类

对输入的单词文本进行处理，实现读入文件，写文件等操作。

2、算法关键

有环的情况要比没有环的复杂度高很多，所以算法第一步要判断是否有环，如果有环，进行普通的深度优先遍历的方法。没有环的话开一个dp数组进行记忆化搜索，性能会提高很多。

对于有首尾字母约束的情况下，没有单独在一个类里面实现，而是通过类的继承来降低模块的耦合性。

UML图

计算模块接口部分的性能改进

性能分析结果：

在小文本数据处理时，并没有遇到很大的性能瓶颈，于是我们利用了大文本进行测试。发现在处理图节点之间连边的函数性能消耗很大，根据VS的性能分析工具，可以看到是在string的处理上进行索引的部分消耗较大，我们使用的是iterator去访问string的头和尾字母。于是最后改成了用下标访问，速度有所提升。

在单词链有隐环的情况下，dfs耗费的时间的确很大，并没有找到改进的方法。

改进之后结果：

Design by Contract, Code Contract

一般认为在模块中检查错误状况并且上报，是模块本身的义务。而在契约体制下，对于契约的检查并非义务，实际上是在履行权利。一个义务，一个权利，差别极大。例如：

if (dest == NULL) { ... }

这就是义务，其要点在于，一旦条件不满足，我方（义务方）必须负责以合适手法处理这尴尬局面，或者返回错误值，或者抛出异常。而：

assert(dest != NULL);

这是检查契约，履行权利。如果条件不满足，那么错误在对方而不在我，我可以立刻“撕毁合同”，罢工了事，无需做任何多余动作。这无疑可以大大简化程序库和组件库的开发。

契约所核查的，是“为保证正确性所必须满足的条件”，因此，当契约被破坏时，只表明一件事：软件系统中有bug。其意义是说，某些条件在到达我这里时，必须已经确保为“真”。如果在我这里发现契约没有被遵守，那么表明系统中其他模块没有正确履行自己的义务。

一般来说，在面向对象技术中，我们认为“接口”是唯一重要的东西，接口定义了组件，接口确定了系统，接口是面向对象中我们唯一需要关心的东西，接口不仅是必要的，而且是充分的。然而，契约观念提醒我们，仅仅有接口还不充分，仅仅通过接口还不足以传达足够的信息，为了正确使用接口，必须考虑契约。

契约式编程的优点：实现面向对象的目标：可靠性、可扩展性和可复用性。

缺点：如果异常在程序运行过程中才能够检测出来的话可能导致一些错误。

在本项目中，我们在计算模块中实现了Core接口，并且定义了传入参数的规范，所以可以采用契约式编程，如果传入的参数不合法，或者传入的不是符合规范的字符，说明调用者没有遵循契约调用参数，可以直接assert。在执行无错误程序期间，不应违反契约条件。

在单元测试当中，我们所用的也都是断言。

计算模块部分单元测试展示

1.对图模块的公开类以及公开类里面的公开方法添加单元测试。对于构造函数和公共属性进行单元测试。我们创建了一个测试图模块的单元测试类进行测试。

思路：对图进行构建，改变节点的权重和边的信息，然后寻找图的最长路，看是否和正确结果相同。

部分代码展示：

TEST_METHOD(TestHeadTailGraph)
{
	DFSHeadTailGraph g(4);
	for (int i = 1; i <= 4; i++)
	{
		g.changeVecWeigh(i, 1);
	}
	g.setHeadSingle(3);
	g.setTailSingle(1);
	g.insertEdge(3, 2);
	g.insertEdge(2, 1);
	Assert::AreEqual(2, g.getEdgeNum());
	vector<int> ans = g.getAnsChain();
	Assert::AreEqual(3, (int)ans.size());
}
TEST_METHOD(LoopGraph)
{
	DFSGraph g(4);
	for (int i = 1; i <= 4; i++)
	{
		g.changeVecWeigh(i, 1);
	}
	g.insertEdge(3, 4);
	g.insertEdge(4, 3);

	Assert::AreEqual(true,g.hasCircle());

}

2、对不同参数组合的测试

思路：对于所有参数组合，可以进行分析，寻找最长单词链，最长字母链，是否有环，是否有首尾字母的约束，一共有 2*2*4 = 16 情况，分别构造测试数据进行测试。

测试数据的构建：

对于边界条件，比如只输入一个单词，或者没有找到单词链的情况，都需要单独构造测试数据。
所有单词都互相能构成链的情况，比如 “aaaaa aaa aa a”的情况
最长单词链和最长字母链同时存在但结果不同的情况。
常规测试数据，随机生成。
大文本测试数据。

部分代码展示：

TEST_METHOD(HeadTest_Loop)
{
	char *words[4] = { "cddd","dddc","aac","bad" };
	char *result[4];
	int ans = gen_chain_char(words, 4, result, 'a', 0, true);
	Assert::AreEqual(3, ans);
	string str;
	for (int i = 0; i < ans; i++)
	{
		str.append(result[i]);
	}
	Assert::AreEqual((string) "aaccddddddc", str);
}
TEST_METHOD(TailTest_Loop)
{
	char *words[4] = { "kzz","kdd","ak","ka" };
	char *result[4];
	int ans = gen_chain_char(words, 4, result, 0, 'z', true);
	Assert::AreEqual(3, ans);
	string str;
	for (int i = 0; i < ans; i++)
	{
		str.append(result[i]);
	}
	Assert::AreEqual((string) "kaakkzz", str);
}
TEST_METHOD(HeadTailTest_Loop)
{
	char *words[13] = { "abcd","defg","gkbb","bmmm","mjjj","jooo" ,"bg","gb"};
	char *result[6];
	int ans = gen_chain_word(words, 8, result, 'd', 'j', true);
	Assert::AreEqual(6, ans);
	string str;
	for (int i = 0; i < ans; i++)
	{
		str.append(result[i]);
	}
	Assert::AreEqual((string) "defggkbbbggbbmmmmjjj", str);
}

3、单元测试覆盖率展示

单元测试覆盖率结果如下，覆盖率达到98%。

计算模块异常处理说明

1、图模块的异常种类

在公有方法中，插入边和修改结点权值的函数需要判断是否溢出边界，如果是要抛出异常。

TEST_METHOD(Vertex_insert_edge_outofrange)
{
	try
	{
		DFSGraph g(3);
		g.insertEdge(5, 6);
	}
	catch (exception &e)
	{
		Assert::AreEqual(edge_out_of_range_error, e.what());
	}
}
TEST_METHOD(Vertex_change_weight_outofrange)
{
	try
	{
		DFSGraph g(3);
		g.changeVecWeigh(4, 8);
	}
	catch (exception &e)
	{
		Assert::AreEqual(vertex_out_of_range_error, e.what());
	}
}

2、Core模块输入无法识别的单词

TEST_METHOD(Core_words_unrecognized)
{
	try
	{
		Core core;
		char *words[3] = { "aa123","32432","333" };
		core.insertChain(words, 3);
	}
	catch (exception &e)
	{
		Assert::AreEqual(m_word_error, e.what());
	}
}

3、在core的接口部分，如果出现len超出最大范围，或者head和tail不在指定的字母范围内，则要抛出异常

TEST_METHOD(Interface_check_head_parameter)
{
	try
	{
		checkParameter(10, 'A', 0);

	}
	catch (exception &e)
	{
		Assert::AreEqual(m_headchar_error, e.what());
	}
}
TEST_METHOD(Interface_check_tail_parameter)
{
	try
	{
		checkParameter(10, 0, 1);

	}
	catch (exception &e)
	{
		Assert::AreEqual(m_tailchar_error, e.what());
	}
}

TEST_METHOD(Interface_check_len_parameter)
{
	try
	{
		checkParameter(1000000, 0, 1);

	}
	catch (exception &e)
	{
		Assert::AreEqual(m_len_error, e.what());
	}
}

4、core部分，如果没有选择enable_loop但是单词链中出现隐环，抛出异常

TEST_METHOD(Interface_check_loop)
{
	try
	{
		char *words[2] = { "abb","baa" };
		char *result[2];
		int ans = gen_chain_word(words, 2, result, 0, 0, false);
		Assert::AreEqual(ans, 0);

	}
	catch (exception &e)
	{
		Assert::AreEqual(m_loop_error, e.what());
	}
}

界面模块的详细设计过程

界面模块我们使用了VS的MFC框架来进行搭建，主要是对用户的输入进行响应，调用我们Core模块的dll接口来进行结果的输出。

首先需要进行需求分析，用户需要哪些交互的模块，需要输入文本框，选项的按钮，文件名的文本框，最终的确认操作按钮，导出文件按钮，结果展示的文本框等。
接下来给每个ui进行代码编辑，响应用户的操作。
对接dll接口进行测试。

部分代码展示：

void CWordChainGUIDlg::OnBnClickedOk()
{
		UpdateData(true);
		char *words[MAX];
		int chainlen;
		if (m_inputFile != "")
		{
			bool isread = read_file(m_inputFile, m_inputWords);
			if(!isread)
			{
				throw exception("file not found!");
			}
			chainlen = dealInput(words, m_inputWords);
		}
		else
			chainlen = dealInput(words, m_inputWords);
		char *result[MAX];
		char head = m_headChar.GetAt(0);
		char tail = m_tailChar.GetAt(0);
		if ((head != 0)&&((head <= 96) || (head >= 123)))
			throw exception("head charactor must be lower alphabet");
		if ((tail != 0)&&((tail <= 96) || (tail >= 123)))
			throw exception("tail charactor must be lower alphabet");

		//printf("%s", m_inputWords);
		if (m_isLongestWord)
		{
			m_answer = gen_chain_word(words, chainlen, result, head, tail, m_enableLoop);
		}
		else
		{
			m_answer = gen_chain_char(words, chainlen, result, head, tail, m_enableLoop);
		}
		CString str;
		for (int i = 0; i < m_answer; i++)
		{
			str += result[i];
			str += "
";
			delete[]result[i];
		}
		m_wordAnsChain = str;
		INT_PTR nRes;               
		AnswerDisplayDlg ansDlg;         
		ansDlg.m_ansLength = m_answer;
		ansDlg.m_wordStr = str;
		nRes = ansDlg.DoModal();   

		UpdateData(false);
		for (int i = 0; i < chainlen; i++)
		{
			delete[]words[i];
		}
		if (IDCANCEL == nRes) 
			return;
}

界面模块与计算模块的对接

ui	功能
单词输入框	可以支持输入单词文本，并且对单词文本进行自动分割处理，和文件输入格式相同
首字母输入框	如果没有内容则默认为0，可以支持输入小写字母，如果输入不合理会有错误框弹出提示
尾字母输入框	如果没有内容则默认为0，可以支持输入小写字母，如果输入不合理会有错误框弹出提示
单词链选项	选择最长单词数目或者最长字母数目
是否允许单词链隐环	默认不允许，如果选择则允许
指定输入文件	如果不输入则默认从单词输入框读取,输入文件名则从文件读取，如果找不到文件则会有错误框弹出提示
生成按钮	设置完后生成单词链，会有新窗口弹出
导出文件按钮	可以填写文件名后导出文件

结对编程

优点：

最大的优点是在于两个人之间可以随时的复审和交流，程序各方面的质量取决于一对程序员中各方面水平较高的那一位。这样，程序中的错误就会少得多，程序的初始质量会高很多，这样会省下很多以后修改、测试的时间。

以下摘自博客

（1）在开发层次，结对编程能提供更好的设计质量和代码质量，两人合作能有更强的解决问题的能力。

（2）对开发人员自身来说，结对工作能带来更多的信心，高质量的产出能带来更高的满足感。

（3）在心理上, 当有另一个人在你身边和你紧密配合, 做同样一件事情的时候, 你不好意思开小差, 也不好意思糊弄。

（4）在企业管理层次上，结对能更有效地交流，相互学习和传递经验，能更好地处理人员流动。因为一个人的知识已经被其他人共享。

缺点：

结对的两个人需要时间磨合，没有尝试过这种模式的人也需要时间去适应。

对于需要研究的项目不适合结对编程。

一些比较简单的测试验证工作，如果需要花较长的时间，结对会造成时间的浪费。

自我评价

优点：执行力较强，态度良好，有合作精神，注意力比较集中，能够较好地统筹规划时间。

缺点：编程能力较弱，对于语言和算法掌握不熟练，花费大量的时间进行学习。

评价队友

优点：能够细心发现bug，态度良好，有合作精神，在合作的过程中能相互学习、相互磨合。

缺点：执行力较弱。

与其他小组的松耦合测试

本组学号：16021160 15061078
合作小组学号：16061109 16061097
出现的问题：

1、在测试另一个小组的dll时，我在文件中写入了中文字符，导致程序没有正常退出，该小组没有对文本的内容进行详细地异常分析，导致程序异常退出。

2、在该小组测试我们dll的时候，发现程序中的bug，即对于所有单词都能构成首尾链的情况输出异常，我们组对自己的bug进行了改进。

3、对方小组使用类封装的dll，分析编译的时候出现warning提示，接口调用需要类的实例化客户端，所以我当时测试的时候是实例化了该Core类，不能直接调用方法进行测试。

PSP表格实际消耗

PSP2.1	Personal Software Process Stages	预估耗时（分钟）	实际耗时（分钟）
Planning	计划	60	2*60
·Estimate	估计这个任务需要多少时间	60	2*60
Development	开发	57*60	71*60
·Analysis	·需求分析 (包括学习新技术)	8*60	9*60
·Design Spec	· 生成设计文档	4*60	2*60
·Design Review	· 设计复审 (和同事审核设计文档)	2*60	1*60
·Coding Standard	· 代码规范 (为目前的开发制定合适的规范)	1*60	1*60
·Design	· 具体设计	5*60	6*60
·Coding	· 具体编码	24*60	36*60
·Code Review	· 代码复审	8*60	12*60
·Test	· 测试（自我测试，修改代码，提交修改）	5*60	5*60
Reporting	报告	5*60	5*60
·Test Report	· 测试报告	2*60	3*60
·Size Measurement	· 计算工作量	1*60	1*60
·ostmortem & Process Improvement Plan	· 事后总结, 并提出过程改进计划	2*60	1*60
	合计	63*60	78*60

相关阅读:
模块 hashlib模块
 设计模式
 类中双下方法
 工作小结常见定制类
 python collections模块
 启动脚本
 anaconda镜像
 理解python的可变参数
 使用spark
python 异常处理
原文地址：https://www.cnblogs.com/zackerzhuang/p/10527520.html

热门文章
智能手机
 VS2012与NUnit
LINQ
缘分
 sqlserver2012
并发编程一
 解决粘包问题
 configparser模块，logging模块
 网络编程后续
 网络编程