• 对于用户需求及反馈的收集


    网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。

    爬虫可以大致分为通用爬虫和聚焦爬虫,其中通用爬虫是搜索引擎的重要组成部分。由于爬虫很少被普通用户直接使用或者接触,所以我们对信息样本的采集

    使用了部分搜索引擎的相关问题。

    本次我们采用了调查问卷的方式,共10个具有代表性的问题,调查样本为30人,以下为具体调查结果。

    1.您的性别  

       男(18)   女(12)

    2.您常用的操作系统

       windows(21)   imac(7)    linux(2)

    3.您对系统内置搜索引擎的感受

       很赞(6)    一般般(10)   很差(14)

    4.您常用的搜索引擎

       百度(13)   谷歌(7)   360(5)    必应(4)   其他(1)

    5.有无对于个人搜索引擎的需求

       有(25)   无(5)

    6.对个人引擎的具体要求(限选2项)

       精准(20)    快捷(22)    界面好(10)   多平台(8)   开源(5)   支持自定义文件类型(7)  其他(10)

    7.爬虫(Crawler)程序是搜索引擎的重要组成部分,它是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本,您之前对于爬虫是否有所了解?

     有(11) 无(19)

    8.如果免费为您提供一个能够通过输入网站链接爬取网页的爬虫软件(安装便利且使用安全),您是否愿意使用?

     是(17)   否(13)

    9.对于一个爬虫软件,您认为下列哪一点最重要?

       爬取速度快(9)   爬取到的页面质量高(7)  在前两者之间达到一种平衡(11)  其他(3)

    10.对于爬虫软件的操作,您认为以下哪一点最关键?

      越简单越好(6)  能够实现的功能越丰富越好(13)  在前两者之间达到一种平衡(9)  其他(2) 

     

  • 相关阅读:
    redis集群规范
    mongodb的基本使用
    redis进阶
    redis基本使用
    selenium的基本使用
    C++入门
    C语言入门
    MATLAB中矩阵reshape的顺序规律
    Tensorflow:ImportError: DLL load failed: 找不到指定的模块 Failed to load the native TensorFlow runtime
    差分定位和精密定位
  • 原文地址:https://www.cnblogs.com/newbe/p/4069895.html
Copyright © 2020-2023  润新知