偶尔会在数据中看到诸如' 这样的字符,特征如下
以&#开头,中间是一串数字,以;结尾
以&开头,中间一串字符,以;结尾
比如最常见的 或者等价的 
浏览器遇到这些转义符,会转义回来,但如何通过代码识别? org.apache.commons.lang.StringEscapeUtils.unescapeHtml提供了很好的说明
遇到上面的第一种情况,中间是数字的,直接将数字(unicode)转为char
遇到第二情况,中间是字符,只能查映射表了,从映射表中找到字符对应的数字再转换为char 看看代码就一目了然了
看看HTML40如何定义的