首页 > 网站 > 建站经验 > 正文

python3简单实现微信爬虫

2024-04-25 20:32:20
字体:
来源:转载
供稿:网友

使用ghost.py 通过搜搜 的微信搜索来爬取微信公共账号的信息‘

# -*- coding: utf-8 -*-

import sys

reload(sys)

import datetime

import time

sys.setdefaultencoding("utf-8")

from ghost import Ghost

ghost = Ghost(wait_timeout=20)

url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"

page,resources = ghost.open(url)

result, resources = ghost.wait_for_selector("#wxmore a")

from bs4 import BeautifulSoup

c=0

while True:

if c>=30:

break

soup = BeautifulSoup(ghost.content)

for wx in soup.find_all("h4"):

print wx

page, resources = ghost.evaluate(

"""

var div1 = document.getElementById("wxbox")

div1.innerHTML = '';

""")

ghost.click("#wxmore a")

result, resources = ghost.wait_for_selector(".wx-rb3")

c=c+1

pass

以上所述就是本文的全部内容了,希望对大家学习Python能够有所帮助

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表