首先要明确阿里是卖服务的 ,MaxComputer 服务
客户端是odps 客户端
其实,直接用Datawork 访问,会受到浏览器跟网络的影响 -- 已经测试
对IE浏览器版本有些支持度不太高,所以,我使用的都是Chrome,主要是去开通服务,并且创建项目空间soar_11
在开通服务中需要记录AK ID 以及 AK Secret ,还有项目空间名称
因为下载客户端,需要对conf 进行配置,需要这三样东西
1. 下载zip ,不需要安装,只需要解压,然后对conf进行配置,这个官网上面有文档比较简单
2.通过cmd 进入到解压文件目录ODPS_DEMOodpscmd_publicin,执行 odpscmd
链接成功后,就可以使用MaxComputer所支持的MaxComputer SQL,对表进行创建等等
语法上面跟传统sql 差异不大,只是会有区别,比起sql 更像pl/sql
其中细节需要使用才知道,当然Maxcompter中能实现一些pl/sql 中没有的部分,例如:mapjoin
又如Insert into/ 到Insert overwrite (这种覆盖数据的增加方式)
我很好奇的是mapjoin 的原理是如何,当然还有其他的一些,这里没有详细去比较列出
其中,有个上次Upload 装载数据的命令
那么,Tunnel upload .csv 数据会收到网络跟文件大小的影响会有多大?
既然MaxComputer是提倡的高效数据运算,csv能装载一次数据也比较有限。。如果高效的把大量的数据迁移过去???