参考:https://www.runoob.com/html/html-entities.html
介绍
html实体编码主要用于输出某些无法作为普通文本显示的字符。
(1)部分字符在html文件中作为html结构解析
(2)某些字符被特殊处理,比如空格
(3)某些字符无法直接输入,比如带声调符号
编码
编码有三种方案:实体名称,十进制实体编号和十六进制实体编号。
重要的编码:
空格    
< < < <
> > > >
& & & &
" " " "
' ' (IE不支持) ' '
编码查询
1、在线
https://unicode-table.com/cn/0073/
通过该网址查询字符,可以查询到字符的html实体编码,实际就是单字符的编码查询。
比如查询字母s:
s
2、Burp的Decoder模块
选择HTML编码,可以对字符串进行批量的html编码或解码。比如编码abc:
abc
使用
1、html实体编码在浏览器的html页面中,除了html注释和script标签的内容、meta标签的属性,其他地方都支持html自解码,即解码成编码前的字符。
2、html自解码的字符不担任任何html结构字符,比如开始标签或结束标签的<>字符,属性的引号,属性之间的空格间隔。
3、多个空格的实体编码解码之后,直接输出显示,不会被省略