介绍了如何让任务型聊天机器人(对话系统)更加鲁棒的相关技术。视频来自台大陈蕴侬老师的深度学习课程。课程主页:https://www.csie.ntu.edu.tw/~miulab/s108-adl/,PPT链接:https://www.csie.ntu.edu.tw/~miulab/s108-adl/doc/
decoder 和 encoder 不一样的地方在于:后面产生的字不能做 attention(还没出现)
mask 出现在 decoder 而不是 encoder
加M:加一个负无限大的值,限制 attention
linearize: BFS
Google FB 给的结果只有Top1
没有之前那个 graph(语音辨识,多路径图)
让embedding 也能【听】,不仅仅能【读】