• TDD(测试驱动设计):通过大量测试寻找最优解决方案


      这两天,我一直在做“测试人员”,不过跟一般的测试人员不同的是,我是在写代码做测试,这些代码是我头脑中的某种设计理念的表示,我坚信,只有不断的“测试”我的这些设计,才能够找到最优的解决方案。

        最近我在设计开发一个“wcf邮件通信系统”,目的是为了在两个不能够直接通信的环境中使用邮件作为消息通道,所以系统的关键之一就是邮件收发的效率和稳定性,怎么样才能够使得邮件内容最小?哪种格式的邮件内容处理最快?哪种方案能够消耗最小的cup资源而又占用合适的内存大小?下面是我的一个测试过程:

    1,对象序列化测试
    象使用xml序列化,占用的存储量太大;
    json序列化,由于使用的是第三方类库,无法控制序列化细节,占用存储量还是比较大;
    自定义实体类序列化器,细节由我完全控制,占用存储量最小;

    2,数据存储格式测试
    数据采用文本还是二进制方式存储?当然二进制存储量最小,但是文本格式可以有很高的压缩比,而且可读性好,这恰是二进制的缺点;

    3,字符编码格式测试
    使用gb2312,utf-8还是ascii?gb2312比较适合汉字处理,utf-8不会有国际化表示问题,ascii显然不行,它是7位字节表示的,还有没有效率更高的?这就需要测试了,最后终于找到一种编码格式:iso-8551,这是一种8位编码格式,非常适合处理二进制的字节数据。

    4,压缩格式测试
    使用winrar?不开源,除了问题比较麻烦,而且客户机器需要安装它;
    使用zip 格式?开源的用过,以前好像还是发现有问题;
    使用gzip?.net框架自己带的,相信不会有大问题,但用的少,还是需要测试;

    5,数据编码方案测试
    经过反复测试,发现很多邮件系统对于正文中包含大量的ascii字符有可能识别为垃圾邮件或者病毒邮件,根本无法发送邮件,所以直接使用base64格式对正文编码的方案泡汤,来看只有自己编码了,那要怎么编码才会认为是安全的?看下面的数据格式:
    686a,0f00,0105,--双16进制格式,
    686a0f,000105,--3字节16进制格式,

    显然,采用3字节16进制格式能够更节省存储量,但反复测试发现,当正文长度超过100,000,opensmtp组件发送邮件很不稳定,经常无法发出,但是双16进制位格式却没有任何问题,只有这样了:-《

    经过这些天以来不断的测试,不断的修改原有的邮件收发的设计方案,最终采用了“自定义实体类序列化+二进制数据存储+iso-8551字符编码+双16进制格式数据编码 ”的设计方案,由于对象数据本身已经是二进制了,各种压缩工具对于二进制数据几乎没有压缩效率,所以省去了“数据压缩”这个过程,最终在数据存储量、传输效率、cpu效率方面取得了最佳平衡。

    所以,测试不仅仅是测试人员的事情,作为开发设计人员,如果要让你的成果是最优的,那么采用tdd吧,反复测试你的设计,最终找到最优的解决方案。

    下面是附带的测试数据:
    --------------------------
    **新版查询结果(采用最优方案):
    1,查询全部雇员数据:
    198962 字符,(编码前,下同)
    500390 字符,(编码后,下同)

    2,查询客户数据,国家 usa,
    1957 字符,
    4222 字符,

    ------------------------
    *旧版本结果(json序列化+base64编码+数据压缩):
    1,查询客户数据,国家 usa,
    8706 字符,
    6230 字符,

    2,查询全部雇员数据:
    534022 字符,
    830348 字符,
  • 相关阅读:
    ssh
    ssh免密码登陆
    滑雪[dp]
    Help Jimmy[dp]
    动态规划 [子序列问题]
    最佳加法表达式 [dp]
    求排列的逆序数[归并排序]
    输出前m大个数,时间复杂度O(n+mlog(m)) [快排]
    不会递归?五道例题教你如何递归
    函数模板的琐碎笔记
  • 原文地址:https://www.cnblogs.com/bluedoctor/p/1864676.html
Copyright © 2020-2023  润新知