图神经网络,强化学习,对话策略
对话状态:food=chinese
置信状态(分布):food= chinese 0.6,italian 0.4
简单的聚合函数是平均,下边是两种改进方案:
【词级别信息引入网络?】