首页 > 编程 > ASP > 正文

ASP在UTF-8页面下将GB2312模式下编码字符串转换为汉字

2024-05-04 11:06:43
字体:
来源:转载
供稿:网友

今天做个小功能的时候遇到的问题,我当前的页面是utf-8编码,获取百度来源url中的汉字编码有可能是gb下的,在网上搜了很久,解决方法最多的一个例子是利用xmlhttp远程请求一下再次获取,但这样无疑加重了代码的执行效率,其他更好的方法也没搜到,但这个方法肯定不能立即使用的,所以最终想到了另个办法。

举个例子,如:“汉字”

在utf-8下的编码为:%E6%B1%89%E5%AD%97

在gb2312下的编码为:​%BA%BA%D7%D6

而我的网页当前为utf-8编码下,那么如何将这些纯粹的编码字符串转换为汉字呢?

首先,我的页面中要包含下面这个函数:

Function URLDecode(enStr)
    Dim deStr,strSpecial
    Dim c,i,v
    deStr=""
    strSpecial="!""#$%&'()*+,.-_/:;<=>[email protected][/]^`{|}~%"
    For i=1 To Len(enStr)
        c=Mid(enStr,i,1)
        If c="%" Then
            v=eval("&h"+Mid(enStr,i+1,2))
            If inStr(strSpecial,Chr(v))>0 Then
                deStr=deStr&Chr(v)
                i=i+2
            Else
                v=eval("&h"+ Mid(enStr,i+1,2) + Mid(enStr,i+4,2))
                deStr=deStr & Chr(v)
                i=i+5
            End If
        Else
            If c="+" Then
                deStr=deStr&" "
            Else
                deStr=deStr&c
            End If
        End If
    Next
    URLDecode=deStr
End Function

上面这个函数是一个url解码函数,下面的函数是utf-8编码转换为汉字的函数:

Function UTF2GB(utfStr)
    For Dig=1 To Len(utfStr)
        '如果UTF8编码文字以%开头则进行转换
        If mid(UTFStr,Dig,1)="%" Then
            'UTF8编码文字大于8则转换为汉字
            If Len(UTFStr) >= Dig+8 Then
                GBStr=GBStr & ConvChinese(mid(UTFStr,Dig,9))
                Dig=Dig+8
            Else
                GBStr=GBStr & mid(UTFStr,Dig,1)
            End If
        Else
            GBStr=GBStr & mid(UTFStr,Dig,1)
        End If
    Next
    UTF2GB = GBStr
End Function
'UTF8编码文字将转换为汉字
Function ConvChinese(x)
    A=split(mid(x,2),"%")
    i=0
    j=0
    For i=0 To UBound(A)
        A(i)=c16to2(A(i))
    Next
    For i=0 To UBound(A)-1
        DigS=InStr(A(i),"0")
        Unicode=""
        For j=1 To DigS-1
            If j=1 Then
                A(i)=Right(A(i),Len(A(i))-DigS)
                Unicode=Unicode & A(i)
            Else
                i=i+1
                A(i)=Right(A(i),Len(A(i))-2)
                Unicode=Unicode & A(i)
            End If
        Next
        If Len(c2to16(Unicode))=4 Then
            ConvChinese=ConvChinese & Chrw(Int("&H" & c2to16(Unicode)))
        Else
            ConvChinese=ConvChinese & Chr(Int("&H" & c2to16(Unicode)))
        End If
    Next
End Function
'二进制代码转换为十六进制代码
Function c2to16(x)
    i=1
    For i=1 To len(x) Step 4
        c2to16=c2to16 & Hex(c2to10(Mid(x,i,4)))
    Next
End Function
'二进制代码转换为十进制代码
Function  c2to10(x)
    c2to10=0
    If x="0" Then Exit Function
    i=0
    For i= 0 To Len(x) -1
        If Mid(x,Len(x)-i,1)="1" Then c2to10=c2to10+2^(i)
    Next
End Function
'十六进制代码转换为二进制代码
Function c16to2(x)
    i=0
    For i=1 To Len(Trim(x))
        tempstr= c10to2(CInt(Int("&h" & Mid(x,i,1))))
        Do While Len(tempstr)<4
            tempstr="0" & tempstr
        Loop
        c16to2=c16to2 & tempstr
    Next
End Function
'十进制代码转换为二进制代码
Function c10to2(x)
    mysign=Sgn(x)
    x=abs(x)
    DigS=1
    Do
        If x<2^DigS Then
            Exit Do
        Else
            DigS=DigS+1
        End If
    Loop
    tempnum=x
    i=0
    For i=DigS To 1 Step-1
        If tempnum>=2^(i-1) Then
            tempnum=tempnum-2^(i-1)
            c10to2=c10to2 & "1"
        Else
            c10to2=c10to2 & "0"
        End If
    Next
    If mysign=-1 Then c10to2="-" & c10to2
End Function

在正常的utf-8页面下,我们可以直接这样用:

Response.Write UTF2GB("%E6%B1%89%E5%AD%97")

即:UTF2GB("%E6%B1%89%E5%AD%97") = "汉字"

但若当前utf8页面获取到的是一个gb下的编码(如​%BA%BA%D7%D6),该怎么转换成汉字呢?这时候就要用到上面那个URLDecode(enStr)解码函数了,但不能直接用,要特别注意进行临时改变下当前页面的编码模式,应用示例如下:
<%

Session.CodePage = 936 '强制转换到GB2312下
Dim mykey:mykey = URLDecode("%BA%BA%D7%D6") 'GB下的编码字符串
Session.CodePage = 65001 '将页面再次回到utf-8编码下
Response.write(mykey)

%>

这时就获得了汉字了。怎么样,简单吧,下次记得关注本站哦-在远方。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表