Synchronization (wait memory)
Waiting for dependent memory accesses such as texture sampling or buffer read/write.
uber shader 里面很容易遇到这个memory wait
改下shader的写法能提升1ms左右
bloom tex resolution对这个事情没有什么影响
bloom tex format降低能再降1ms
涉及 sample这边的消耗 和带宽这边的限制
uber的rt降低肯定能改善这个事情
留着这2ms放alu