在实际工作上有种需求, 就是需要从给定的数据里,随机抽取一部分。
有一种简单的方法是根据总的数据条数和要抽取的数据条数, 通过简单方法,隔几行取一个,这样也能达到随机抽取一部分的目的。
但这样,源数据是顺序的,则抽取的数据也是顺序的,不满足一些情境。
这里实现的功能是: 将全部数据,按行重新随机排列, 这样从结果头部选几行,就是随机抽取的几行了,比较方便。
实现的思路: 对于N行的数据, 给每一行用[1-N]之间不重复的数做标记, 最后按标记数排列即可。(不重复上要稍微费点儿心思)
实现思路比较重要,实现就简单了~
实现上用c结合shell的方式,下面为参考代码。
#总控脚本:用不重复随机数做标记,然后按标记排序
#随机化的执行程序random的实现