用于查看熵的各种公式:
https://www.cnblogs.com/kyrieng/p/8694705.html#name4
各种熵的直观解释,为什么能选择交叉熵作为Loss:
https://www.zhihu.com/question/65288314