web常用自动化库——selenium总结

摘要:
概述selenium是一个模拟控制浏览器操作的自动化库,它可以做到元素定位,鼠标事件,浏览器事件,js脚本执行等操作与request不同的是,request是单独请求一个http,而selenium则是以浏览器方式加载整个页面流,所以那些异步的请求也不用像request一样去分析接口,一切都像浏览器一样,所见即所得。

概述

selenium是一个模拟控制浏览器操作的自动化库,它可以做到元素定位,鼠标事件,浏览器事件,js脚本执行等操作

与request不同的是,request是单独请求一个http,而selenium则是以浏览器方式加载整个页面流,所以那些异步的请求也不用像request一样去分析接口,一切都像浏览器一样,所见即所得。

优点是:

1.所见即所得,不用考虑cookie,ajax,重定向等等,方便数据的查取

2.平时在我们在浏览器上做的操作(鼠标,浏览器操作等),基本都可以用这个实现,并且步骤动态可视

3.多平台支持,不仅语言多平台支持,支持浏览器driver也很多

缺点是:

1.慢,由于加载了整个页面的数据流,资源开销大,所以对于只想获取关键数据来说肯定没有请求接口来的快

2.不稳定,脚本维护成本高等,比如你用xpath去找元素,但是前端改其他问题影响到了你这个元素的路径,那么这个脚本就gg

主要作用:

1.用于前端自动化测试,总的来说算集成测试,更关注用户端的测试

2.模拟登录等,爬虫的模拟登录常用到,同时使用这种时要开开发者模式,因为已经有很多网站能识别了

3.个人办公用途,减少重复劳动力。举个栗子:百度云离线下载多个链接

安装

库安装

pip install selenium

WebDriver安装

WebDriver是W3C的一个标准,由Selenium主持,主要目的就是通过这套WebDriverAPI控制你电脑上的浏览器,相当于一个selenium与浏览器之间的驱动,需要注意的是,不同浏览器,需要安装不同的WebDriver,常见的如下

Firefox浏览器https://github.com/mozilla/geckodriver/releases
Chrome浏览器https://sites.google.com/a/chromium.org/chromedriver/downloads
IE浏览器http://selenium-release.storage.googleapis.com/index.html
Edge浏览器https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/
Opera浏览器https://github.com/operasoftware/operachromiumdriver/releases
PhantomJS浏览器https://phantomjs.org/

其中PhantomJS是一个无窗口的WebDriver,现在已经停更了

根据你电脑所装浏览器版本来安装WebDriver(至少需要大版本相同,不然会有一些问题),安装WebDriver很简单,将可执行文件放到脚本目录或者python安装目录即可

WebDriver

创建WebDriver对象

创建WebDriver对象,相当于启动了浏览器

#导入webdriver模块
from selenium importwebdriver
#创建对象,根据你选择的浏览器创建

driver =webdriver.Chrome()
driver =webdriver.Firefox()
driver =webdriver.Ie()
driver =webdriver.Edge()
driver =webdriver.Opera()
driver = webdriver.PhantomJS()

WebDriver对象操作

对WebDriver对象的操作可以抽象成你怎么去控制浏览器,主要方法有:

1.访问URL

driver.get("http://www.python.org")

2.窗口大小调整

#设置宽800px 高600px
driver.set_window_size(800,600)
#设置最大,最小
driver.maximize_window()
driver.minimize_window()

3.刷新页面

driver.refresh()

4.前进后退

driver.forward()
driver.back()

5.关闭浏览器或窗口

#关闭浏览器
driver.quit()
#关闭窗口
driver.close()

6.返回当前的一些属性

#当前url
driver.current_url
#返回窗口句柄
driver.current_window_handle  #当前
driver.window_handles #所有
#返回title
driver.title

7.查找元素,返回Element对象,之后会详细讲

find_element_by_name()
find_element_by_id()
find_element_by_xpath()
find_element_by_link_text()
find_element_by_partial_link_text()
find_element_by_tag_name()
find_element_by_class_name()
find_element_by_css_selector()

8.切换窗口

driver.switch_to_window(handle)

9.切换frame

#切换框架,直接输入iframe的name或id属性,或者传入定位的元素
driver.switch_to_frame(frame_reference)

10.截图保持为文件

#img_path_name为文件路径,只支持.png格式,文件名注意带上后缀,如“/Screenshots/foo.png”
driver.get_screenshot_as_file(img_path_name)

11.执行js

#简单执行
driver.execute_script(script, *args)
    -script:要执行的JavaScript。
    -*args:JavaScript的所有适用参数。
#异步执行
driver.execute_async_script(script, *args)

12.操作cookie

#获取cookies
driver.get_cookies()
#添加cookie
driver.add_cookie(cookie_dict) 
#删除cookie
driver.delete_all_cookies()  #所有
driver.delete_cookie(name) #一个,指明key

元素Element

查找元素Element

在我们使用driver.get(url)方法后,driver会加载整个页面,如果我们要操作比如点击页面中的某个元素,则首先需要定位到这个元素,再进行操作

注意的是这部分需要HTML CSS XPATH基础,不熟悉的可以查看W3C教程,这里不做多诉

示例

<html>
 <body>
  <h1>Welcome</h1>
  <p class="content">Site content goes here.</p>
  <form id="loginForm">
   <input name="username"type="text" />
   <input name="password"type="password" />
  </form>
  <a href="continue.html">Continue</a>
</body>
<html>

1.通过id属性定位

driver.find_element_by_id(‘loginForm’)
#定位<form id="loginForm">

2.通过name属性定位

driver.find_element_by_name(‘username’)
#定位<input name="username" type="text" />

3.通过class名定位

driver.find_elements_by_class_name(‘content’)
#定位<p class="content">Site content goes here.</p>

4.通过TagName标签名定位

driver.find_element_by_tag_name(‘input’)
#定位<input name="username" type="text" />,如果匹配了多个,只选第一个

5.通过link text定位,就是通过a标签的text内容定位

driver.find_elements_by_link_text(‘Continue’) #全匹配 
driver.find_element_by_partial_link_text(‘Cont’) #部分text匹配
#定位<a href="http://t.zoukankan.com/continue.html">Continue</a>

6.通过xpath定位

driver.find_element_by_xpath("//from[input/@name='username']")
#定位<input name="username" type="text" />

简单说一句:/ 代表选取直接子节点,// 代表选择所有子孙节点,. 代表选取当前节点,.. 代表选取当前节点的父节点,@ 则是加了属性的限定并选取匹配属性的特定节点,[]是谓语的意思。

7.通过css选择器定位

driver.find_element_by_css_selector('p.content')
#定位<p class="content">Site content goes here.</p>

8.定位多个元素

将1~7中的find_element_by_xxx改成find_elements_by_xxx则可以返回所有匹配的元素为list

driver.find_elements_by_tag_name(‘input’)
定位[<input name="username" type="text" />
   <input name="password" type="password" />]

9.串联查找

Element对象也是有find_element_by_xxx这些方法的,所以可以在第一次定位的元素下查找子节点等

driver.find_element_by_id(‘loginForm’).find_element_by_name(‘username’)

10.简洁方法

find_element(by='id', value=None)与find_elements(by='id', value=None)实际是实现find_element_by_xxx这个的底层实现,只是简洁些,当然我们也可以用

#导入By模块,实际里面就是id,class,name这些常量
from selenium.webdriver.common.by importBy
driver.find_element(By.NAME,username)

元素Element事件

Element对象有一系列的方法,来让我们操作定位的元素

1.Element.click() 点击元素

driver.find_elements_by_link_text(‘Continue’).click()

2.输入文本

#有些输入框中原有的文本不会被自动清除掉,需要使用clear()方法清除
driver.find_element_by_name(‘username’).clear()
#输入内容
driver.find_element_by_name(‘username’).send_keys("username")

3.获取参数

#获取对应特性值
Element.get_attribute(name)
#获取对应属性值
Element.get_property(name)
#property是DOM中的属性,是JavaScript里的对象;attribute是HTML标签上的特性,它的值只能够是字符串。一般用attr就行
#获取当前元素的内容
Element.text
#获取当前元素标签名
Element.tag_name
#获取当前元素尺寸
Element.size
#获取当前元素坐标
Element.location

4.判断方法

#判断当前元素是否可见
Element.is_displayed()
#判断当前元素是否被启用
Element.is_enabled()
#判断当前元素是否被选中
Element.is_selected()

等待

现在的网页,基本都是使用ajax异步的加载各种资源的,所以可能我们需要定位的元素不会第一时间就加载出来,这时候是无法定位的,也就会抛出异常。而解决这个问题的方法,就是等待。

1.硬性等待

使用time.sleep(sec)实现,需要自己估计网页加载的时间,硬性地等待,无论网页加载快慢,都会强制等待这么多时间

importtime
time.sleep(10)

2.显式等待

就是设定一个条件,同时设置一个时间,在这个时间范围内,如果网页出现符合的条件,就不等待继续执行,如果没有则循环直到超时报错

from selenium importwebdriver
from selenium.webdriver.common.by importBy
from selenium.webdriver.support.ui importWebDriverWait
from selenium.webdriver.support importexpected_conditions as EC
driver =webdriver.Firefox()
driver.get("http://somedomain/url_that_delay_loading")
try:
    element = WebDriverWait(driver,10).until(
        EC.presence_of_element_located((By.ID,"myDynamicElement"))
    )
finally:
    driver.quit()

这段代码主要讲的是:

  1. 实例化WebDriverWait类,传入driver与最大等待时长,默认poll_frequency(扫描频率)为500毫秒
  2. until()是WebDriverWait类的一个方法,参数是一个等待条件(expected_conditions),如果满足等待条件,则WebDriverWait类停止等待,并且返回expected_conditions的值,否则当等待时间到将抛出TimeoutException异常
  3. 除了until()还有个until_not(),看语义就明白
  4. 等待条件(expected_conditions)如果成功则返回element对象,或有些是返回布尔值,或者其它不为null的值

等待条件(expected_conditions)内置的方法主要有:

title_is : #验证 driver 的 title 是否与传入的 title 一致,返回布尔值
title_contains : #验证 driver 的 title 中是否包含传入的 title,返回布尔值
presence_of_element_located :#验证页面中是否存在传入的元素,传入元素的格式是 locator 元组,如 (By.ID, "id1"),返回element对象
visibility_of_element_located : #验证页面中传入的元素( locator 元组格式 )是否可见,这里的可见不仅仅是 display 属性非 None ,还意味着宽高均大于0,返回element对象或false
visibility_of : #验证页面中传入的元素( WebElement 格式 )是否可见。返回element对象或false
presence_of_all_elements_located : #验证页面中是否存在传入的所有元素,传入元素的格式是 locator 元组构成的 list,如 [(By.ID, "id1"), (By.NAME, "name1"),返回element或false
text_to_be_present_in_element : #验证在指定页面元素的text中是否包含传入的文本,返回布尔值
text_to_be_present_in_element_value : #验证在指定页面元素的value中是否包含传入的文本,返回布尔值
frame_to_be_available_and_switch_to_it : #验证frame是否可切入,传入 locator 元组 或 WebElement,返回布尔值
invisibility_of_element_located : #验证页面中传入的元素( locator 元组格式 )是否可见,返回布尔值
element_to_be_clickable : #验证页面中传入的元素( WebElement 格式 )是否点击,返回element
staleness_of : #判断传入元素(WebElement 格式)是否仍在DOM中,返回布尔值
element_to_be_selected : #判断传入元素(WebElement 格式)是否被选中,返回布尔值
element_located_to_be_selected :#判断传入元素(locator 元组格式)是否被选中,返回布尔值
element_selection_state_to_be :#验证传入的可选择元素(WebElement 格式)是否处于某传入状态,返回布尔值
element_located_selection_state_to_be : #验证传入的可选择元素(WebElement 格式)是否处于某传入状态,返回布尔值
alert_is_present : #验证是否有 alert 出现。返回alert对象

3.隐式等待

一种全局的设置,设置一个最大时长,如果定位的元素没有出现就会循环的查询直到超时或者元素出现,相比于硬性等待,这个更加弹性,元素出现了就不会等待了

rom selenium importwebdriver
driver =webdriver.Firefox()
driver.implicitly_wait(10) #seconds
driver.get("http://somedomain/url_that_delays_loading")
myDynamicElement = driver.find_element_by_id('myDynamicElement')

行为链

ActionChains可以完成简单的交互行为,例如鼠标移动,鼠标点击事件,键盘输入,以及内容菜单交互。这对于模拟那些复杂的类似于鼠标悬停和拖拽行为很有用

使用方法:

实例化一个ActionChains对象并在对象上调用行为方法时,这些行为会存储在ActionChains对象的一个队列里。只有调用perform()时,这些动作就以他们队列的顺序来触发

导入类

from selenium.webdriver import ActionChains

链式模型操作:

menu = driver.find_element_by_css_selector(".nav")
hidden_submenu = driver.find_element_by_css_selector(".nav #submenu1")
ActionChains(driver).move_to_element(menu).click(hidden_submenu).perform()

队列顺序操作:

menu = driver.find_element_by_css_selector(".nav")
hidden_submenu = driver.find_element_by_css_selector(".nav #submenu1")
actions =ActionChains(driver)
actions.move_to_element(menu)
actions.click(hidden_submenu)
action.perform()

主要的行为方法有

click(on_element=None)
#点击一个元素。参数:on_element:要点击的元素,如果是None,点击鼠标当前的位置

click_and_hold(on_element=None)
#鼠标左键点击一个元素并且保持。参数:on_element:同click()类似

double_click(on_element=None)
#双击一个元素

drag_and_drop(source, target)
#鼠标左键点击source元素,然后移动到target元素释放鼠标按键

drag_and_drop_by_offset(source, xoffset,yoffset)
#拖拽目标元素到指定的偏移点释放。参数: source:点击的参数 xoffset:X偏移量 * yoffset:Y偏移量

key_down(value,element=None)
#只按下键盘,不释放。我们应该只对那些功能键使用(Contril,Alt,Shift)。参数: value:要发送的键,值在Keys类里有定义 element:发送的目标元素,如果是None,value会发到当前聚焦的元素上

key_up(value,element=None)
#释放键。参考key_down的解释

move_by_offset(xoffset,yoffset)
#将当前鼠标的位置进行移动

move_to_element(to_element)
#把鼠标移到一个元素的中间

move_to_element_with_offset(to_element,xoffset,yoffset)
#鼠标移动到元素的指定位置,偏移量以元素的左上角为基准。参数: to_element:目标元素 xoffset:要移动的X偏移量 * yoffset:要移动的Y偏移量

perform()
#执行所有存储的动作

release(on_element=None)
#释放一个元素上的鼠标按键

send_keys(*keys_to_send)
#向当前的焦点元素发送键

send_keys_to_element(element,*keys_to_send)
#向指定的元素发送键

参考的key值在这里

弹窗操作

目前主流弹窗就三种,alert,window,div封装的

alert弹窗

alert弹窗主要是js中alert()、confirm()、prompt()方法实现的,虽然这三种在js中不同,但对selenium都可以统一实例化Alert对象处理,首先查看Alert对象的主要方法

#接受和忽略弹框:

Alert(driver).accept()
Alert(driver).dismiss()
#prompt里输入字符:

Alert(driver).send_keys("text")
#读取prompt的提示字符:

Alert(driver).text
#向一个认证的对话框发送用户名和密码,会自动点击确认

Alert(driver).authenticate('user','passwd')

对于弹窗生成Alert对象主要有两种方法

1.使用driver的API切换至弹窗操作

alert = driver.switch_to_alert() #底层实际就是Alert(driver),返回Alert对象

2.直接使用Alert类实例化

from selenium.webdriver.common.alert importAlert
alert = Alert(driver)

window类型

window类型实际就是那种点击界面元素后,浏览器新开的一个窗口,我们可以用driver的API直接切换到这个窗口进行一般的定位元素那些操作

#选择对应的window_handle切换
driver.switch_to_window(window_handle)
#window_handle获取
driver.current_window_handle
driver.window_handles

div封装的

div封装的弹窗就是使用浏览器F12查看HTML源代码时,弹窗的代码由div标签封装在页面中,所以这种弹窗可以直接find_element_by_xxx直接定位

可能还有网页中使用frame标签的,这就需要先切换到新的frame,上面driver的方法有介绍

如果对JavaScript熟悉的,这些弹窗都可以用js处理

参考:

https://python-selenium-zh.readthedocs.io/zh_CN/latest

https://selenium-python.readthedocs.io/api.html

免责声明:文章转载自《web常用自动化库——selenium总结》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇linux --&amp;gt; 获取系统启动时间单例模式实现下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

html component(htc)入门(转)

http://docs.oracle.com/javame/dev-tools/lwuit-1.4/LWUIT_Developer_Guide_HTML/bbjidhgf.html 官方文档 初识HTC HTC是HTML Component的缩写,是IE5及后续版本浏览器所支持的客户端组件。HTC就是一组以DHTML为基础封装了客户端行为的脚本,每HTC以...

爬虫之selenium

selenium基本操作 概念:基于浏览器自动化的模块 appnium:基于手机自动化的模块的应用 环境的安装 pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple 跟爬虫之间的关联? 可以实现模拟登陆 便捷的捕获动态加载数据(可见即可得) 基本操作 导包:...

(appium+python)UI自动化_02_appium启动手机app

前提:需先安装配置好appium+python自动化环境,已配置好环境的小伙伴可以参考以下步骤启动Android app,具体步骤如下: 一、USB连接手机 (1)手机USB连接电脑 (2)手机打开开发者模式、USB调试功能 二、基础信息配置 1,获取设备号 终端获取设备号,指令:adb devices   2,获取apk包名、activity (1)打开...

element Image组件

<template> <div class="el-image"> <slot v-if="loading"name="placeholder"> <div class="el-image__placeholder"></div> </slot>...

Spring5源码分析(020)——IoC篇之解析自定义标签

注:《Spring5源码分析》汇总可参考:Spring5源码分析(002)——博客汇总   默认标签的解析,前面已基本分析完毕。剩下的就是自定义标签的解析这一块: /** * Parse the elements at the root level in the document: * "import", "alias", "bean". * &l...

Selenium---元素定位之CSS定位

CSS 选择器: 常见符号: #表示 id选择器 .表示 class选择器 >表示子元素,层级 一个空格也表示子元素,但是是所有的后代子元素,相当于 xpath 中的相对路径 一、css:属性定位 1.css可以通过元素的id、class、标签这三个常规属性直接定位到 2.如下是百度输入框的的html代码: <input type="text"...