• 结对第一次—原型设计(文献摘要热词统计)


    所属课程 福州大学软件工程实践(2019)
    作业要求 原型设计(文献摘要热词统计)
    结对学号 221600330、221600331
    作业目标 练习原型设计,培养合作能力
    制作的原型 软工实践-论文爬取原型设计
    pdf下载 本篇随笔在线pdf pdf(百度网盘 提取码:ymnn )

    一、NABCD#

    N(Need,需求)##

    问题:###

    小樱是一名大三的学生,一直痴迷于吃鸡类游戏,某日听闻同宿舍的小狼刚和导师去参加了CVPR会议,内心羡慕不已,便下定决心痛改前非、努力钻研,希望能在毕业前完成一篇站在时代前沿的优秀论文。但令人苦恼的是,他不知道近几年顶会的热门领域和研究方向,根据论文list去一篇一篇查找总结效率又着实太低,于是求助于“软工实践互助爱心组织”,希望我们能帮助他设计一个平台解决现阶段的需求。

    需求:###

    • 根据用户给定的网址爬取里面论文的题目、摘要、关键词、年份、发布平台、原文链接
    • 展示近几年各个顶会的热门领域和研究方向,
    • 在已爬取的论文中分析热门领域或热门研究方向;
    • 根据论文的题目、作者、关键词、年份、属性(oral、spotlight、poster)进行筛选,并返回相关的paper、source code、homepage等信息;
    • 可对多年间、不同顶会的热词呈现热度走势对比(这里将范畴限定在计算机视觉的三大顶会CVPR、ICCV、ECCV内);
    • 形成如关键词图谱之类直观的查看方式;

    A(Approach,做法)##

    • 1、平台
      • 经过讨论,我们决定用手机APP的形式来满足需求,手机APP软件的优势:
        • 无需依靠其他媒体和应用,即可实现自己的移动营销。
        • 无需输入,即可轻松浏览。
        • 随时随地,互联互通。
        • 全方位、多媒体显示。
        • 最便捷的企业宣传册。
        • 资料更新,一步到位。新产品、新服务或者新信息发布,更新一步到位。
        • 移动互联网企业名片。
        • 有效占领移动互联网入口。这些优势能够快速占领一定的商业位置。
      • 在”墨刀“上进行原型设计。
    • 2、针对用户需求
      • 我们提供从用户提供的网址爬取网页内的论文信息的功能,包括标题,作者,关键词,发表年份,摘要等等。用户如果发现信息错误可以选择修改或者删除论文,等到用户选择完毕后点击收录将论文信息存储至软件数据库中以便后续的分析与操作。
      • 对已录入的论文提供检索功能
      • 对已录入的论文提供分析功能
      • 在论文详情页提供原文链接。
    • 3、额外功能
      • 设置收藏论文功能,在我的收藏页可方便找到自己收藏过的论文。
      • 提供关于三大会议相关的新闻页面,方便读者查看三大会议的最新消息。
      • 提供软件内外的分享功能。
      • 提供论文的源码,pdf文档下载。
      • 提供论文评论功能。
      • 提供软件内的私聊功能,用户可通过点击分享的论文链接直接进入论文页

    B(Benefit,好处)##

    • 用户不必根据论文列表一篇一篇查找,只需要提交列表即可得出查找结果,用户可以更高效地得到结果,节省了时间和精力。
    • 我们的软件给用户提供了精美的页面让用户看了心情舒畅。
    • 我们帮助用户整理、分析了论文清单,并直接呈现部分关键信息,方便用户学习,节省了时间;
    • 为用户推送近期学术新闻和热点。

    C(Competitors,竞争)##

    优点:

    • 我们将平台定位于手机app,使用app简单便捷,相对于web端更使用大众人群。
    • 免费使用
    • 界面简单,对于用户通俗易懂。
    • 一站式论文处理分析,优化用户体验
      缺点:
    • 功能简单,缺乏专业网站的分析能力
    • 竞争对手过多,没有突出的个性功能
    • 只用python爬取网站时对算法要求高,爬取整个网页计算量大。在软件自带的数据库中排序与分析大量数据也是一大技术难题
    • 在没有资源方合作的情况下论文来源不稳定,容易被站方反爬虫应对。

    D(Delivery,推广)##

    • 由于与我们软件相对应的客户群体比较少,所以没必要大规模地到处打广告,只需要针对我们的客户群体进行一些宣传。
    • 我们可以和一些涉及论文的微信公众号、微博合作,让其帮我们做一些宣传。
    • 还有就是可以在一些高校群里做一些宣传(跟他们的管理员商量好后)。

    二、原型展示#

    • 1:登录注册界面

      • 点击画面中的蓝色加号进入注册页面
      • 点击画面底下图标使用其他软件账号登录
      • 输入账号密码后进入软件主页面
    • 2:主页:新闻页面,页面上为与各大会议有关的信息

      • 点击菜单栏1进入个人信息页面 、点击图标2进入个人收藏的论文页面 、点击图标3进入论文检索页面、页面5为论文页面,有着与论文检索分析有关的功能。
    • 3:论文搜寻界面

      • 用户在论文检索界面输入网址,软件爬取网页内的论文信息,包括标题,作者,关键词等。用户可以选择修改或者删除论文,等到用户选择完毕后点击收录将论文信息存储至软件数据库中以便后续的分析与操作。
    • 4:我的收录界面

      • 用户可在已经收录的论文中进行高级检索,包括标题,作者,论文属性,年份等
    • 5:论文分析界面

      • 从软件数据库中对会议热词、论文数量、论文属性等数据进行统计分析

      • 界面1展示了收录论文的几大热词,以及热词的详细排行。输入热词搜索后可以查询与该热词有关的功能

      • 界面2用图表记录了论文数量、属性占比、与数据库各会议论文占比等信息

    • 6:论文详情页面

      • 在搜索结果或者我的收藏页面可点击文章,并进入详情页。
      • 详情页底部分为三个按钮,左边为论文讨论区,点击可以进入评论区评论。
      • 中间按钮为分享与下载按钮,点击会出现四个选项,分别为下载pdf原文,分享至微博,下载源码,分享至私聊。
      • 点击下载后详情页出现下载标识,并在软件后台下载。
      • 右边按钮即收藏与取消收藏。
      • 用户可选择单词进行在线翻译。
    • 7:私聊页面

      • 用户可在评论区或者个人主页直接私聊。可通过私聊功能进行论文分享,日常聊天等。其他用户点击链接即进入论文详情。
    • 8:个人信息页面

      • 记录了用户个人信息,例如收藏论文数量,关注人数量,以及个人的微博,github,email地址等信息。

    三、结队过程照片#



    四、PSP表格#

    PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
    Planning 计划 20 45
    • Estimate • 估计这个任务需要多少时间 20 45
    Development 开发 360 420
    • Analysis • 需求分析 (包括学习新技术) 60 45
    • Design Spec • 生成设计文档 20 30
    • Design Review • 设计复审 120 100
    • Coding Standard • 代码规范 (为目前的开发制定合适的规范) 0 0
    • Design • 具体设计 60 70
    • Coding • 具体编码 0 0
    • Code Review • 代码复审 0 0
    • Test • 测试(自我测试,修改代码,提交修改) 0 0
    Reporting 报告 180 200
    • Test Report • 测试报告 0 0
    • Size Measurement • 计算工作量 0 0
    • Postmortem & Process Improvement Plan • 事后总结, 并提出过程改进计划 30 50
    合计

    五、总结#

    遇到的困难###

    • 在软件设计过程中由于对许多专业名词不了解,例如热度趋势、关键词图谱等,这样在讨论展示效果时无从下手,浪费了很多时间去查资料。
    • 以及在设计原型界面过程中,由于第一次接触这类工具,对设计工具的不熟练也导致界面往往到达不了想要的效果,例如花了很多时间去学习使用全局手势以及各个状态的跳转。
    • 设计能力的缺乏,导致在画原型界面草稿时无从下手,或者画出非常简陋的界面,需要学习之后才能尝试着将功能与美感合并。
    • 还有有时两个人的设计审美不同,会导致一些分歧的发生。

    效能分析###

    • 软件实际运行效能应该非常依赖于排序与统计算法,因为用python爬取网页会得到非常多的数据。需要思考如何在软件数据库较快地统计分析排序,以及如何将数据用图表方式展示出来。
  • 相关阅读:
    [NOI2003]文本编辑器
    [TyvjP1413]费用流模板裸题
    POJ 3255 dijkstra次短路
    [TyvjP1474]二维线段树区间更新+查询
    [转]二分图的必须边
    匈牙利算法代码及理解
    jloi2013一些想法
    uva11987 并查集小技巧
    【水】tyvj1523 平面几何入门
    Tyvj1462 细节凸包
  • 原文地址:https://www.cnblogs.com/xiang-peng/p/10470054.html
Copyright © 2020-2023  润新知