1、数据迁移过程中,验证数据拷贝后大小是否一致;
shell命令:
hadoop fs -count -q 目录 ps: 查看目录下总的大小
dfs -count -q 目录 ps:一样的
hadoop fs -du 目录 ps:查看目录下每个子目录的大小
2、随机森林和GBDT的区别
1、数据迁移过程中,验证数据拷贝后大小是否一致;
shell命令:
hadoop fs -count -q 目录 ps: 查看目录下总的大小
dfs -count -q 目录 ps:一样的
hadoop fs -du 目录 ps:查看目录下每个子目录的大小
2、随机森林和GBDT的区别