使用Python自动填写问卷星(pyppeteer反爬虫版)

摘要:
写这篇文章的目的是让自己更容易忘记在寒假开始时填写问卷明星,就像去年一样。我去年写了一个版本,认为今年只是更改数据和ID,发生了其他意想不到的事情……自信地从selenium import webdriverinporttimeimportrandomdefrun():browser=webdriver编写代码。Chrome()浏览器。get(“URL”)#1js=“文档

写此文的目的是为了方便寒假自己忘记填问卷星

一开始的想法和去年一样,去年就写过一版,想着今年不过就是改改数据,换换id而已,另外没想到的事情发生了。。。

满怀信心的写完代码

from selenium import webdriver
import time
import random

def run():
    browser = webdriver.Chrome()
    browser.get("网址")

    # 1
    js = "document.getElementById("q1").click()"
    browser.execute_script(js)
    browser.switch_to.frame("__calendarIframe")
    js2 = "document.getElementById("selectTodayButton").click()"
    browser.execute_script(js2)
    browser.switch_to.parent_frame()


    # 2
    js = "document.getElementById("q2").click()"
    browser.execute_script(js)
    browser.switch_to.frame("__calendarIframe")
    js2 = "document.getElementById("selectTodayButton").click()"
    browser.execute_script(js2)
    browser.switch_to.parent_frame()


    # 3
    js = "document.getElementById("q3_1").click()"
    browser.execute_script(js)

    # 4
    browser.find_element_by_id("q4").send_keys("学号")

    # 5
    browser.find_element_by_id("q5").send_keys("姓名")

    # 6
    js = "document.getElementById("q6_1").click()"
    browser.execute_script(js)

    # 7
    js = "document.getElementById("q7_3").click()"
    browser.execute_script(js)

    # 8
    js = "document.getElementById("q8_1").click()"
    browser.execute_script(js)
    browser.find_element_by_class_name("underline").send_keys("第一次1月9日阴性")

    # 9
    js = "document.getElementById("q9_2").click()"
    browser.execute_script(js)

    # 10
    js = "document.getElementById("q10_2").click()"
    browser.execute_script(js)

    # 11
    js = "document.getElementById("q12_2").click()"
    browser.execute_script(js)

    # 12
    browser.find_element_by_id("q14").send_keys("36."+str(random.randint(0,5))+"/36."+str(random.randint(0,5)))

    #13
    js = "document.getElementById("q15_2").click()"
    browser.execute_script(js)

    #14
    js = "document.getElementById("q17_2").click()"
    browser.execute_script(js)

    #15
    browser.find_element_by_id("q19").click()
    time.sleep(1)
    browser.switch_to.frame("PDF_i_chezchenz")
    browser.find_element_by_id("txtInput").send_keys("地址")
    js3="document.getElementById("btnSearch").click()"
    browser.execute_script(js3)
    time.sleep(1)
    browser.find_element_by_css_selector("a.ensure_btn").click()
    time.sleep(1)
    browser.switch_to.default_content()

    # 16
    js = "document.getElementById("q20_2").click()"
    browser.execute_script(js)

    # 17
    browser.find_element_by_id("q22").send_keys("")


    # 18
    browser.find_element_by_id('select2-q23-container').click()
    # js = "document.getElementById('select2-q23-container').click()"
    # browser.execute_script(js)
    browser.find_element_by_xpath("//li[@class='select2-results__option'][1]").click()
    # js = "document.getElementById("select2-q23-result-ei9q-1").click()"
    # browser.execute_script(js)

    # submit
    js = "document.getElementById("submit_button").click()"
    browser.execute_script(js)


if __name__ == "__main__":
    while True:
        run()
        time.sleep(4)
        break

数据都填上了,可他来了一个这玩意

使用Python自动填写问卷星(pyppeteer反爬虫版)第1张

 然后

使用Python自动填写问卷星(pyppeteer反爬虫版)第2张

 之后了解到用用pyppeteer解决反爬的方法,安装python第三方库asynciopyppeteerpyppeteer_stealth

完整代码如下:

import asyncio
from pyppeteer import launch
from pyppeteer_stealth import stealth #反爬
import random
import time
async def run():
    driver = await launch({
        # 谷歌浏览器的安装路径
        'executablePath': 'C:Program Files (x86)GoogleChromeApplicationchrome.exe',
        # Pyppeteer 默认使用的是无头浏览器
        'headless': False,
        # 设置Windows-size和Viewport大小来实现网页完整显示
        'args': ['--no-sandbox', '--window-size=1024,768']
    })
    page = await driver.newPage()
    await page.setViewport({'width': 1024, 'height': 768})
    # 反爬虫跳入网页
    await stealth(page)
    await page.goto('网址')
    time.sleep(1)
    #1 问卷填报日期
    date=await page.querySelector('#q1')
    await date.click()
    frame =page.frames
    date2= await frame[1].querySelector('#selectTodayButton')
    await date2.click()
    #2 体温测量日期
    date = await page.querySelector('#q2')
    await date.click()
    frame = page.frames
    date2 = await frame[1].querySelector('#selectTodayButton')
    await date2.click()
    #3 班级
    await page.click('#divquestion3 > ul > li > a')
    #4 学号
    await page.type('#q4','学号')
    #5 姓名
    await page.type('#q5','姓名')
    # 6 性别
    await page.click('#divquestion6 > ul:nth-child(2) > li:nth-child(1) > a')
    #7 所在地区
    await page.click('#divquestion7 > ul > li:nth-child(3) > a')
    #8 核酸
    await page.click('#divquestion8 > ul > li:nth-child(1) > a')
    await page.type('#divquestion8 > ul > li:nth-child(1) > input.underline','第一次1月9日阴性')
    #9 隔离情况
    await page.click('#divquestion9 > ul > li:nth-child(2) > a')
    #10 密切接触
    await page.click('#divquestion10 > ul:nth-child(2) > li:nth-child(2) > a')
    #12 病例
    await page.click('#divquestion12 > ul:nth-child(2) > li:nth-child(2) > a')
    #14 体温
    temperature="36."+str(random.randint(2,6))+'/'+"36."+str(random.randint(2,6))
    print(temperature)
    await page.type('#q14',temperature)
    #15 同住人员密切接触
    await page.click('#divquestion15 > ul:nth-child(2) > li:nth-child(2) > a')
    #17 同住人员病例
    await page.click('#divquestion17 > ul:nth-child(2) > li:nth-child(2) > a')
    #19 地理位置
    address= await page.querySelector('#q19')
    await address.click()
    time.sleep(5)
    frame=page.frames
    await frame[2].type('#txtInput','地址')
    time.sleep(1)
    await frame[2].click('#btnSearch')
    time.sleep(1)
    await frame[2].click('.ensure_btn')
    #20 居住地变化
    await page.click('#divquestion20 > ul:nth-child(2) > li:nth-child(2) > a')
    # 22 异常情况
    await page.type('#q22','')
    #23 同住人员
    await page.click('#select2-q23-container')
    persion=await page.xpath("//li[@class='select2-results__option'][1]")
    await persion[0].click()
    time.sleep(2)
    #提交
    await page.click('#submit_button')
if __name__ == '__main__':
    asyncio.get_event_loop().run_until_complete(run())

就提交成功了!!!

免责声明:文章转载自《使用Python自动填写问卷星(pyppeteer反爬虫版)》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇设计模式之PIMPL模式Flatbuffers学习下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

转载:前端大牛们都学过哪些东西?

作者:秦墨鱼链接:http://www.zhihu.com/question/22146521/answer/94842197来源:知乎著作权归作者所有,转载请联系作者获得授权。 学过的东西杂而不精,算不得大牛。带过前端团队,也算是有几年前端负责人的经验。随着这几年前端node.js,react,Angularjs等技术新起,越来越多从之前单纯的前端开发到...

多进程浏览器、多线程页面渲染与js的单线程

线程与进程 说到单线程,就得从操作系统进程开始说起。在早期的操作系统中并没有线程的概念,进程是能拥有资源和独立运行的最小单位,也是程序执行的最小单位。任务调度采用的是时间片轮转的抢占式调度方式,而进程是任务调度的最小单位,每个进程有各自独立的一块内存,使得各个进程之间内存地址相互隔离。后来,随着计算机的发展,对CPU的要求越来越高,进程之间的切换开销较大,...

前端工程打开速度优化的循序渐进总结

优化的重要指标: 页面打开速度(Fully Loaded) 网站首页(或列表页)之 First View :打开速度应在 3秒+0.5秒 内; 对 Repeat View 时的各项指标暂不作要求; 首屏打开时间(Start Render) 网站首页(或列表页) 之 First View :首屏渲染速度应在 1秒+0.5秒 内; 文档解析完毕时间(Do...

JS实现整个DIV里的字号整体放大或缩小

JS实现对DIV里内容的字体方法或缩小 html代码 只写主要代码,样式可以自己写 <div class="content_sms"> 这是需要放大或缩小的内容 </div> <!--放大缩小按钮--> <div id= "bigFontSize">放大 </div> <div id...

webstorm像idea调试java一样调试npm的js项目

一.相关软件安装和配置   安装WebStorm   WebStorm官网:( https://www.jetbrains.com/webstorm/ )   安装Chrome和JetBrains IDE Support   JetBrains IDE Support的地址是:        https://chrome.google.com/websto...

C#使用技巧之调用JS脚本方法一

有时候我们需要在C#中直接调用js方法,这是完全没问题的。当然,我们也可以把js代码转化为C#,然后在C#中执行,但是这个就得花时间了~~下面我给大家介绍下一种直接在C#中调用JS文件的方法。 0、贴个效果图 1、创建个Winform项目。 2、在From1上增加一个文本框一个按钮。 3、在解决方案中创建一个test.js文件。 test.js代码如下:...