selenium 基础(一)

摘要:
但是selenium操作浏览器还需要一个驱动程序,不同的浏览器如filefox,chrome所需要的驱动程序不一样,就算是同款浏览器,因为浏览器内部提供的原生自动化接口API不同,也需要适配不同版本的驱动程序,不然就有可能出现调用接口失败的情况。webdriver按照server-client经典设计模式设计,client可以理解为测试脚本,selenium支持多种语言,server端可以理解为浏览器,client和server的通信根据theWebDriverWire协议告诉服务端我们希望浏览器接下来做什么事情。

selenium安装

pip install selenium

selenium操作浏览器原理

早期selenium 1.0 用的selenium RC, 后来selenum2集合了selenium1.0 + webdriver,selenium RC被webdriver替换。通过webdriver,测试脚本(例如python)可以方便的通过API操作浏览器页面元素,包括打开,关闭,最大化,最小化,元素定位,元素单击等等等。但是selenium操作浏览器还需要一个驱动程序,不同的浏览器如filefox,chrome所需要的驱动程序不一样,就算是同款浏览器,因为浏览器内部提供的原生自动化接口API不同,也需要适配不同版本的驱动程序,不然就有可能出现调用接口失败的情况。

webdriver按照server-client经典设计模式设计,client可以理解为测试脚本,selenium支持多种语言(java,python,ruby,php等),server端可以理解为浏览器,client和server的通信根据the WebDriver Wire协议告诉服务端我们希望浏览器接下来做什么事情。

驱动下载

Chrome:  https://sites.google.com/a/chromium.org/chromedriver/downloads
Edge:  https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/
Firefox:  https://github.com/mozilla/geckodriver/releases
Safari:  https://webkit.org/blog/6900/webdriver-support-in-safari-10/

一个selenium简单的例子:(相应驱动要放在path环境变量中)

from selenium import webdriver
browser = webdriver.Chrome()
url = 'http://www.baidu.com'
browser.get(url)

浏览器基础操作

方法比较多,先整理一些,有需要后面再补充进来(有些参考了webdriver.py和webelement.py)

新建一个driver,初始化要操作的浏览器

driver = webdriver.Chrome()

访问url

driver.get(url)

最大化窗口

driver.maximize_window()

设置窗口宽,高

driver.set_window_size(width,height)

页面操作

browser.back()
browser.forward()
browser.refresh()
browser.close() 关闭当前窗口
browser.quit()  退出驱动并关闭每个关联窗口

页面信息

browser.title    
browser.current_url
browser.current_window_handle 返回当前窗口句柄
driver.window_handles 所有窗口handle

frame切换

switch_to_frame()
switch_to_window()

对话框

switch_to_alert()

控件填写信息,也可以是文件上传

send_keys()

回车

send_keys(Keys.RETURN)

判断元素是否可见

is_displayed()

操作cookie

get_cookies()
get_cookie(name)
delete_cookie(name)
delete_all_cookies()
add_cookie(cookie_dict)

显式等待和隐式等待
显式等待会让WebDriver等待满足一定的条件以后再进一步的执行。 而隐式等待让Webdriver等待一定的时间后再才是查找某元素。

显式等待

WebDriverWait(driver, 10).untile(EC.visibility_of_element_located((By.CLASS_NAME, "logo_sogou")))

隐式等待

implicitly_wait(10)

屏幕截屏

save_screeshot(filepath)

元素查找

id查找

find_element_by_id("xxx")

name查找

find_element_by_name("xxx")

class查找

find_element_by_class_name("xxx")

css查找

find_element_by_css_selector('.s_ipt')

XPath查找

类似于xml定位一样,html的标签也可以用这类方式来查找,而且更健壮

find_element_by_xpath("/html/body/form[1]")
find_element_by_xpath("//form[1]")   html页面中第一个form元素
find_element_by_xpath("//div[@id='search_ext']")
find_element_by_xpath("//div[@class='ipt_wrap']/span[1]")
find_element_by_xpath("//input[@name='continue'][@type='button']")

超链接查找

find_element_by_link_text('Continue')  完全匹配
find_element_by_partial_link_text('Conti')   部分匹配

一次查找返回多个元素(list)

find_elements_by_name
find_elements_by_xpath
find_elements_by_link_text

参考文章:

http://selenium-python-zh.readthedocs.io/en/latest/index.html

免责声明:文章转载自《selenium 基础(一)》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇beeline: 新版连接Hive server的工具IDEA将maven项目打包时同时带上项目的maven依赖下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

Selenium Webdirver API(1)

Selenium Webdirver API 前提:引入webdriver包 from selenium import webdriver 1、创建浏览器对象driver = webdriver.Ie(executable_path="D:\IEDriverServer")#不同浏览器只需更改浏览器名称即可,如:webdriver.Chrome() web...

使用selenium的方式获取网页中图片的链接和网页的链接,来判断是否是死链(二)

上一篇使用Java正则表达式来判断和获取图片的链接以及跳转的网址,这篇使用selenium的自带的API(getAttribute)来获取网页中指定的内容 实现内容:获取下面所有图片的链接地址以及跳转地址,使用get请求判断是否有死链 页面内容如图: 页面的源码,需要获取页面的href后的地址,以及src后的地址,: 代码实现可以看出图片都在一个div...

webDriver运行过程中遇到的问题

1.org.openqa.selenium.firefox.NotConnectedException: Unable to connect to host 127.0.0.1 on port 7055 after 45000 ms.  【原因】:     selenium的版本和firefox的版本不兼容  【解决方法】:        更新seleni...

python+selenium三:鼠标事件与键盘事件

1、鼠标事件:# 每个模拟事件后需加.perform() 才会执行# context_click() 右击# double_click() 双击# drag_and_drop(source, target) 拖动# move_to_element() 鼠标悬停# move_to 移动 from selenium import webdriverfrom...

使用Postman或requests结合chromedriver模拟Selenium操作浏览器

Selenium是一款浏览器自动化测试框架,基于Webdriver协议。从本质上来说: webdriver是一套接口标准,使用标准的HTTP RESTful接口,使用JSON格式传递数据。 chromedriver是实现该标准的Chrome浏览器的一套驱动服务。 Selenium实际上是对各种接口操作的封装 seleniumwebdriver.remo...

selenium cookie登录

前言 爬虫方向的小伙伴们都知道网页爬虫经常遇到的问题就是登录账户,有些简单的网站我们可以简单的send key来输入账户密码就可以登录,但是有很多网站需要验证码之类的就不太好用了,这时候就体现到了cookie登录的优点了,前段时间网上搜了搜,发现没有什么完整的教程,本文就使用selenium来cookie登录为例做一个简单的教程。 环境准备 python...