首页 > 编程 > ASP > 正文

用javascript解决外部数据抓取中的乱码问题

2024-05-04 10:58:03
字体:
来源:转载
供稿:网友
我们一般会在两个地方用到外部数据抓取,一个是在asp中,一个是在hta中。如果外部数据是gb2312编码的,就涉及到转码的问题,但是传统的用vbs函数进行处理的方法,运算量比较大,有些特殊字符还会出错。
    如果用adodb.stream控件来进行转码,就简单多了,不需要借助vbs的二进制处理函数了,同时速度快了很多。
复制代码 代码如下:

<script> 
function loadData(sUrl){ 
    var xh 
    xh=new ActiveXObject("Microsoft.XMLHTTP") 
    xh.open("GET",sUrl,false) 
    xh.send(null) 
    return gb2utf8(xh.responseBody) 

function gb2utf8(sData){ 
    var oStream 
    oStream=new ActiveXObject("adodb"+".stream")  
    oStream.Type=1  
    oStream.Mode=3  
    oStream.Open  
    oStream.Write(sData) 
    oStream.Position=0  
    oStream.Type=2  
    oStream.Charset="GB2312" 
    return oStream.ReadText() 

</script>  

您可能感兴趣的文章:

零基础写Java知乎爬虫之将抓取的内容存储到本地零基础写Java知乎爬虫之抓取知乎答案java抓取鼠标事件和鼠标滚轮事件示例java根据url抓取并生成缩略图的示例java抓取12306信息实现火车余票查询示例java抓取网页数据示例java 抓取网页内容实现代码java抓取网页数据获取网页中所有的链接实例分享java在网页上面抓取邮件地址的方法
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表