在做商业智能项目的早期阶段,我们通常需要对很多数据进行整理和清洗。其中一个典型任务就是过滤一些重复值。例如给你一个表格,大致有10000行数据,要把其中的非重复的行找出来。
这个工作其实不那么容易,特别是如果条件还比较复杂的话。也确实有朋友是这么做:将数据导入到SQL Server,然后用SELECT DISTINCT语句查询,然后再导出来。
值得高兴的是,在Excel 2007中,有这么一个工具,正好可以做这样的事情。
点击“删除重复项”
点击“确定”