[结对同学的博客链接:031602603陈超星 http://www.cnblogs.com/ccxccx/p/9693159.html
本作业博客的链接
Github项目地址
PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
Planning | 计划 | 0 | 0 |
· Estimate | · 估计这个任务需要多少时间 | 240 | 420 |
Development | 开发 | 0 | 0 |
· Analysis | · 需求分析 (包括学习新技术) | 10 | 10 |
· Design Spec | · 生成设计文档 | 0 | 0 |
· Design Review | · 设计复审 | 0 | 0 |
· Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | 0 | 0 |
· Design | · 具体设计 | 10 | 10 |
· Coding | · 具体编码 | 80 | 80 |
· Code Review | · 代码复审 | 0 | 0 |
· Test | · 测试(自我测试,修改代码,提交修改) | 10 | 10 |
Reporting | 报告 | 120 | 300 |
· Test Repor | · 测试报告 | 0 | 0 |
· Size Measurement | · 计算工作量 | 10 | 10 |
· Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 0 | 0 |
解题思路描述与设计实现说明
爬虫使用【3'】
先匹配得到所有论文的简介页面,然后再匹配得到标题和摘要,详见github
代码组织与内部实现设计(类图)【6'】
说明算法的关键与关键实现部分流程图【6'】
关键代码解释【2'】
先判断参数,再匹配单词组与不合法单词:
再匹配单词(流程与上次作业差不多),加了2个列表用于缓存单词和分隔符,然后组成单词组加入TreeMap
单元测试【5'】
输入:
0
Title: Monday Tuesday Wednesday Thursday
Abstract: Monday Tuesday Wednesday Thursday Friday
命令行:java Main -i C:UsersASUSDesktop .txt -m 3 -n 3 -w 1 -o o.txt
输出:
characters: 74
words: 9
lines: 2
<monday tuesday wednesday>: 11
<tuesday wednesday thursday>: 11
<wednesday thursday friday>: 1
输入:
0
Title: abcd 1abcd abcd (abcde
Abstract: abcd a1abcd abcd (abcde abc1 abcd
命令行:java Main -i C:UsersASUSDesktop .txt -m 2 -n 3 -w 1 -o o.txt
输出:
characters: 56
words: 7
lines: 2
<abcd (abcde>: 11
贴出Github的代码签入记录【1'】
评价你的队友【2'】
非常好
学习进度条【1'】
第N周 | 新增代码(行) | 累计代码(行) | 本周学习耗时(小时) | 累计学习耗时(小时) | 重要成长 |
---|---|---|---|---|---|
1 | 0 | 0 | 1 | 1 | |
2 | 100 | 100 | 7 | 8 | 学会了HashMap的排序 |
3 | 0 | 100 | 7 | 15 | 学了NABCD模型 |
4 | 0 | 0 | 2 | 17 | |
5 | 100 | 200 | 10 | 27 | 学会了简单地抓取网页信息 |