• 一步步实现cnblogs博客采集工具


    欢迎继续关注CnblogsFan开源项目, 在昨天的项目时间中, 我们已经完成了项目开始前的一些准备工作, 今天, 我们就一起来分析下项目的一些需求。

     

    在对需求进行分析之前我们先来再次熟悉下一个完整项目的开发流程, 如图所示:

    这里简略的图示了一下软件开发的一般过程, 对于详细流程查阅相关书籍或者到互联网上查看。

    现在我们开始进入了这个项目的第一步需求调研分析。

     

    一、确定用户层次

      由于不同的用户对电脑的使用熟练程度不同, 我们可以把用户分为5个层次:

      ①."小白"用户

        刚接触电脑, 对电脑没有任何基础, 仅能完成对电脑的基本操作。

     

      ②. 普通用户

        对电脑有一定了解, 能够熟练的使用一些基本的常用软件, 能够顺利的完成对软件的安装与卸载。

     

      ③. 高级用户

        能够熟练的使用电脑, 使用过一些较为专业的处理软件。

     

      ④. 专业用户

        对电脑有全面的了解, 自身的职业与电脑操作有关或接受过相关的专业培训, 能够熟练的使用办公软件。

     

      ⑤. IT从业者及其以上

        对电脑的操作毫无压力。

     

      在设计软件时必须要考虑软件面向的用户属于哪一层次, 利于我们队软件开发的过程中找准侧重点, 对于普通用户我们往往可以在软件的操作方式以及界面上小做文章, 而对于相对于对电脑使用比较熟练的高级用户, 我们则更应该在软件的功能实现上多费一些笔墨, 当然, 在条件允许的情况下我们自然要选择功能更强, 界面更美观, 使用更简单!

     

      对于CnblogsFan这个项目针对的用户群, 对电脑都有较为熟练的操作, 属于高级用户以上, 因此在界面的设计上我们可以使用一些较为专业的术语, 增强软件的专业性。

     

    二、用户的需求

      正如项目简介中那样, CnblogsFan目的是为了方便采集收藏博客园中的一些随笔"。采集随笔"便是整个项目要实现的功能范围具体如何采集是编码人员要解决的事情但是现在Wid是一个人在做这个项目因此Wid只要既充当用户也要充当软件分析设计人员以及编码人员。

     

     

     

    1>. 用户的角度:

      从用户的角度来考虑: 如果我想要对博客园随笔进行采集, 我会希望有更多更灵活的采集方式供我选择, 我所希望的采集方式如下:

        1. 蜘蛛模式

          模拟蜘蛛对cnblogs随笔的进行大范围的采集;

     

        2. 限制随笔发表时间

          可以指定一个时间段, 对于一些较旧的随笔我不想采集;

     

        3. 指定采集某个用户

          我只想采集某些用户的随笔;

     

        4. 过滤一些用户

          我不想采集某些用户的随笔;

     

        5. 只采集首页/精华/候选区的随笔

          我只对这些随笔有兴趣;

     

        6. 其他想要的功能还没想好, 想好了随时通知你们; ( Wid : -_-||| )

     

        除了这些基本功能外, 你们再添加一些尽可能灵活的采集方式。

     

     

    2>. 博客园的角度:

     

      1>. 采集时必须保留博客作者的相关信息。

     

      2>. 在每篇采集到的随笔中要注明"该文章通过CnblogsFan博客园随笔采集工具采集自XXX用户的博客, 原文地址:http://"一句。

     

      3>. 其他想要的功能还没想好, 想好了随时通知你们; ( Wid : ...... )

     

    三、分析需求

      通过用户与博客园提交的需求可以两点基本需求:

        ①. 软件要有灵活的采集方式;

        ②. 要保留作者的相关信息。

      除此之外还有一个不确定因素, 就是需求可能会随时变动.(o(╯□╰)o)

     

    在确定基本需求后就是围绕需求对软件进行初步设计, 初步设计内容将在下一篇随笔中进行叙述。

     

    欢迎继续关注CnblogsFan开源项目的最新进展, Wid将会坚持在每天的空闲时间完成对该项目的开发(如果博客园以及博客园的用户们允许Wid这么做)。

    GitHub项目地址: https://github.com/mrwid/CnblogsFan

     

    --------------------

     

    一些题外话: Wid现在每天坚持更新至少2篇的原创随笔, 目的只有两个, 一是希望能通过写博客的方式提高自己的技术水平, 二是希望能在博客园认识更多的朋友, 和大家一起交流进步, 如果您对Wid的随笔有任何意见或建议, 恳请提出, Wid会根据您的意见或建议认真的改进、提高。

     

    Wid, 2012.10.09

     

     

    上一篇: 开源->一步步实现cnblogs博客采集工具->项目前的准备工作

     

     

     

    开源项目案例分析

     
    摘要: 欢迎继续关注CnblogsFan开源项目, 在昨天的项目时间中, 我们已经完成了项目开始前的一些准备工作, 今天, 我们就一起来分析下项目的一些需求。在对需求进行分析之前...阅读全文
    posted @ 2012-10-09 23:33 wid 阅读(604) | 评论 (1) 编辑
     
    摘要: 欢迎光临Wid的博客! cnblogs采集工具的相关介绍: 项目名称: CnblogsFan 简介: 用来采集cnblogs随笔的一个开源工具。 开发语言: Python 图形库: WxPython 开发环境...阅读全文
    posted @ 2012-10-08 22:47 wid 阅读(57) | 评论 (0) 编辑
     
    摘要: 大家好, 欢迎光临Wid的博客! 这里是新开的分类 —— 开源项目案例分析。 最近虽说在学习Windows程序设计, 但是还是想在平时的空闲时间敲一些小的开源项目巩固以前学...阅读全文
    posted @ 2012-10-08 20:05 wid 阅读(18) | 评论 (0) 编辑
     
    标签: 开源CnblogsFan
  • 相关阅读:
    CSS基础学习(二)
    CSS基础学习(一)
    《人月神话》读后感(第五六章)
    Python基础学习
    团队项目介绍
    全国疫情数据可视化展示(详细介绍)
    《人月神话》读后感(第三四章)
    拓展欧几里德
    Siano
    操作系统内存大页(THP)对redis性能的影响
  • 原文地址:https://www.cnblogs.com/Leo_wl/p/2717815.html
Copyright © 2020-2023  润新知