【AI测试】也许这有你想知道的人工智能 (AI) 测试--开篇

人工智能测试

什么是人工智能，人工智能是怎么测试的。可能是大家一开始最想了解的。 640?wx_fmt=png 让机器实现原来只有人类才能完成的任务；比如看懂照片，听懂说话，思考等等。

举个例子，把人工智能比做水果。如果有人问你 “水果是怎么吃的”，你可能不知道怎么回答。

机器学习项目怎么测试
推荐系统项目怎么测试
图像识别项目怎么测试
自然语言处理项目怎么测试。

目前应用最广泛的人工智能也是这四个类型。

刚刚把人工智能比作水果，我们知道，吃水果的方法有很多。可以把机器学习比作一种吃水果的方法。如果用刀切这种方法。深度学习又是机器学习的一个分支。大概的关系图如图中显示。 640?wx_fmt=png

测试什么

一般这些项目都要测试什么，要进行什么类型的测试。

1. 模型评估测试

2. 稳定性/鲁棒性测试

3. 系统测试

4. 接口测试

5. 文档测试

6. 性能测试

7. 白盒测试–代码静态检查

8. 竞品对比测试

9. 安全测试

发布上线后，线上模型监控

测试数据

不管是机器学习，推荐系统，图像识别还是自然语言处理，都需要有一定量的测试数据来进行运行测试。

上线只是完成了一半测试，并不像APP或者WEB网站测试一样，测试通过后，发布到正式环境，测试工作就完成了。

测试集独立同分布
测试数据的数量和训练数据的比例合理

测试集独立同分布

测试数据的数量和训练数据的比例合理

如果数据量是百万级别，那么验证集和测试集占数据总量的比例会趋向于变得更小。如果拥有百万数据，我们只需要1000条数据，便足以评估单个分类器，并且准确评估该分类器的性能。假设我们有100万条数据，其中1万条作为验证集，1万条作为测试集，100万里取1万，比例是1%，即：训练集占98%，验证集和测试集各占1%。对于数据量过百万的应用，训练集可以占到99.5%，验证和测试集各占0.25%，或者验证集占0.4%，测试集占0.1%。 640?wx_fmt=jpeg

一般算法工程师会将整个数据集，自己划分为训练集、验证集、测试集。或者训练集、验证集等等。（这里的测试集是算法工程师的测试数据）

测试用例思考点

相关阅读:
每天一个linux命令（40）：wc命令
每天一个linux命令（39）：grep 命令
每天一个linux命令（38）：cal 命令
每天一个linux命令（37）：date命令
每天一个linux命令（36）：diff 命令
每天一个linux命令（35）：ln 命令
[android] Activity 的生命周期以及横屏竖屏切换时 Activity 的状态变化
Android onConfigurationChanged 不执行
faster-rcnn anchor 介绍
Faster-rcnn centos tensorflow

原文地址：https://www.cnblogs.com/finer/p/11895035.html