用 access 分析网站一例
问题:
如何用 access 分析一个网站,或者在网站上提交一个查询,得到结果后存储进数据库哪?
如何用 access 下载 dvbbs 论坛上所有的帖子?
如何用 access 编写灌水程序?
方法一:
答案非常简单—— dhtml 编程。
有人可能问了,access 使用的是 vba ,而 dhtml 中使用的是 vbs 怎么可能通用哪?其实 vbs / vba 都是 vb 的子集。在 access 中只要引用
microsoft internet controls
microsoft html object library
即可,然后在窗体上加入 “microsoft web 浏览器”控件
好了,下面就以我写的一个读取某 ip 物理地域查询网站页面的数据库为例说明 dhtml / “microsoft web 浏览器”控件在 access 的应用吧。
“microsoft web 浏览器”控件的作用是什么哪?主要就是为了获得 document 对象的,dhtml 的操作都是以 document 对象为运行基础的。
要完成读取网页的功能我们必须了解 dhtml 的几个简单的对象以及属性
1、document 对象:代表这整个 html 文档
2、body 对象:是 document 对象的子对象,里面存储着所有显示给用户看的 html 代码
3、innertext 属性:页面中显示给客户看的文本,注意:不是 html 代码呦
4、innerhtml属性:构成页面的 html 代码
5、对象.all.length属性:页面中所有 element 的个数。(all 用于表示所有对象)
ok ,接下来就让我们一边写代码,一边分析吧:
option compare database
dim blnswitch as boolean
private sub command1_click() '用于启动浏览功能
me.webbrowser3.navigate ("http://ip.loveroot.com/index.php?job=search")
end sub
private sub command11_click() '将需要搜索的ip 写入全局变量
splitip text1.value
end sub
function splitip(strip) '将需要搜索的ip 写入全局变量
dim a() as string
strip = strip & "."
a = split(strip, ".")
dim i as long
for i = 0 to ubound(a)
if a(i) = "" then a(i) = "0"
lngsearchip(4 - i) = clng(a(i))
next i
end function
sub writelog(ip1 as string) '读取结果
dim dc as mshtml.htmldocument
dim bd as mshtml.htmlbody
dim el as mshtml.htmlelementcollection
dim strip as string
dim stradd as string
dim strsql
dim i as long
set dc = webbrowser3.document
set bd = dc.body
dim lngstart as long
'循环 document 中所有的元素获取需要的字符
for i = 0 to dc.all.length - 1
'由于该服务器重写界面,我改了一下分析代码
'if dc.all(i).tagname = "p" and left(dc.all(i).innertext, 4) = "查询结果" then
if dc.all(i).tagname = "p" and left(dc.all(i).innertext, 8) = "官方数据查询结果" then
'由于该服务器重写界面,我改了一下分析代码
'stradd = mid(dc.all(i).innertext, instr(1, dc.all(i).innertext, "(") + 2, instr(1, dc.all(i).innertext, ")") - instr(1, dc.all(i).innertext, "(") - 3)
'strip = mid(dc.all(i).innertext, instr(1, dc.all(i).innertext, "查询结果:") + 6, instr(1, dc.all(i).innertext, "(") - instr(1, dc.all(i).innertext, "查询结果:") - 7)
stradd = right(dc.all(i).innertext, len(dc.all(i).innertext) - instr(dc.all(i).innertext, " - ") - 3)
strip = strnowip
labelsip.caption = strip & stradd
'ok 终于得到需要的数据了,用 sql 语句直接写入数据库吧
strsql = "update ipaddress set [ip1]='" & strip & "',[add]='" & stradd & "' where mark='last'"
currentproject.connection.execute strsql
strsql = "insert into ipaddress([ip1],[add],[mark],[enip]) values('" & strip & "','" & stradd & "','no'," & cstr(enaddr(strip)) & ")"
currentproject.connection.execute strsql
exit for
end if
next i
dim strnewip as string
strnewip = refreship
on error resume next
'利用 dhtml 的 innerhtml 来更改网页的源代码,建立一个简单的 form ,然后提交给服务器,继续查询下面的 ip
bd.innerhtml = "<form method='post' action='index.php?job=search' target='_parent'><input type='text' name='search_ip' ><input type='submit' value='查询' name='b1'></form>"
'在 input text search_ip 中填入 ip。
dc.all.item("search_ip").value = strnewip
'用 dhtml 提交 form 到服务器
dc.all.item("b1").click
end sub
private sub form_open(cancel as integer)
text1.value = nz(dlookup("ip1", "ipaddress", "[mark]='last" & me.caption & "'"), "1.0.0.0")
end sub
private sub webbrowser3_downloadcomplete()
'该事件在页面成功下载到本地时运行,这时候 document 对象
'已经完全被客户端浏览器读取了,我们只要获取 body 对象中的 innerhtml 即可
if len(strnowip) = 0 then
splitip text1.value
end if
if check1.value = true then
call writelog("61.12.15.117")
end if
end sub
function refreship() as string '搜索完一个ip以后再搜索下面一个
dim i as long
lngsearchip(2) = lngsearchip(2) + 1
for i = 2 to 4
if lngsearchip(i) >= 256 then
lngsearchip(i) = 0
lngsearchip(i + 1) = lngsearchip(i + 1) + 1
end if
next i
refreship = format(lngsearchip(4), "0") & "." & format(lngsearchip(3), "0") & "." & format(lngsearchip(2), "0") & "." & format(lngsearchip(1), "0")
strnowip = refreship
debug.print refreship
end function
以下代码请新建一个模块后 copy 进去
option compare database
public lngsearchip(4) as long
public strnowip as string
public strokaddress as string
public strokip as string
public blnstop as boolean
function writeokip()
dim rs as new adodb.recordset
dim strsql as string
strsql = "select * from ipaddress order by enip"
rs.open strsql, currentproject.connection, 1, 1
dim stradd1 as string
dim strip1 as string
dim lngenip1 as long
dim strstate as string
strstate = "start"
dim i as long
dim ia as long
ia = rs.recordcount
do until rs.eof
if blnstop = true then exit function
if stradd1 <> rs("add") then
strsql = "update ipaddress_ok set ip2='" & strip1 & " ',enip2=" & str(lngenip1) & ",mark='' where mark='setting'"
currentproject.connection.execute strsql
doevents
strsql = "insert into ipaddress_ok (ip1,enip1,[mark],[add]) values('" & rs("ip1") & "'," & str(rs("enip")) & ",'setting','" & rs("add") & "')"
currentproject.connection.execute strsql
doevents
end if
stradd1 = rs("add")
strip1 = rs("ip1")
lngenip1 = rs("enip")
i = i + 1
form_控制.label4.caption = str(int(i / ia * 10000) / 100) & "%"
rs.movenext
loop
rs.close
strsql = "update ipaddress_ok set ip2=mid(ip2,1,len(ip2)-2) & '255'"
currentproject.connection.execute strsql
strsql = "update ipaddress_ok set enip1=enaddr(ip1)"
currentproject.connection.execute strsql
strsql = "update ipaddress_ok set enip2=enaddr(ip2)"
currentproject.connection.execute strsql
end function
function enaddr(sip as string) as double
'用代理无法连接的问题还要解决
'将字符的 ip 编码为长整的 ip
on error resume next
dim str1 as string
dim str2 as string
dim str3 as string
dim str4 as string
sip = cstr(sip)
str1 = left(sip, cint(instr(sip, ".") - 1))
sip = mid(sip, cint(instr(sip, ".")) + 1)
str2 = left(sip, cint(instr(sip, ".")) - 1)
sip = mid(sip, cint(instr(sip, ".")) + 1)
str3 = left(sip, cint(instr(sip, ".")) - 1)
str4 = mid(sip, cint(instr(sip, ".")) + 1)
enaddr = clng(str1) * 256 * 256 * 256 + clng(str2) * 256 * 256 + clng(str3) * 256 + clng(str4) - 1
end function
function deaddr(sip)
'将编码为长整的 ip 重现转换为字符型的 ip
dim s1, s21, s2, s31, s3, s4
sip = sip + 1
s1 = int(sip / 256 / 256 / 256)
s21 = s1 * 256 * 256 * 256
s2 = int((sip - s21) / 256 / 256)
s31 = s2 * 256 * 256 + s21
s3 = int((sip - s31) / 256)
s4 = sip - s3 * 256 - s31
deaddr = cstr(s1) + "." + cstr(s2) + "." + cstr(s3) + "." + cstr(s4)
end function
示例请参考:http://access911.net/down/eg/user_dhtml_search_ip.rar
上述程序会自动去 http://ip.loveroot.com/index.php?job=search 搜索所有的 ip 以及对应的物理地址并保存到数据库中
修订:刚才上了一下网站,发现界面竟然改了,又重新修改了一下读取页面的程序。
关于 webbrowser 控件的资料请参考 vb6 中 msdn 的以下章节
internet client sdk
internet tools & technologies
reusing the webbrowser and mshtml
inet401/help/itt/ieprog/ieprog.htm#book_browsing(bookmark)
http://access911.net 站长收藏