python爬虫+使用cookie登录豆瓣

摘要:
2017-10-0919:06:22版权声明:本文为博主原创文章,未经博主允许不得转载。前言:先获得cookie,然后自动登录豆瓣和新浪微博系统环境:64位win10系统,同时装python2.7和python3.6两个版本(本次使用python3.6),IDE为pycharm,浏览器为chorme,使用的python第三方库为requests查看cookie:首先登陆豆瓣首页,并且登录账户(注意

2017-10-09 19:06:22

版权声明:本文为博主原创文章,未经博主允许不得转载。

前言:

先获得cookie,然后自动登录豆瓣和新浪微博

系统环境:

64位win10系统,同时装python2.7和python3.6两个版本(本次使用python3.6),IDE为pycharm,浏览器为chorme,使用的python第三方库为requests

查看cookie:

首先登陆豆瓣首页,并且登录账户(注意练习爬虫时最好用小号),右键检查,点击Network,然后按Fn+F5刷新页面,点击最上面的www.douban.com选项,即可找到cookie信息

python爬虫+使用cookie登录豆瓣第1张

登录:

复制cookie到如下代码中:

importrequests

headers = {'User-Agent': ''}
cookies = {'cookie': ''}
url = 'http://www.douban.com'r = requests.get(url, cookies = cookies, headers =headers)
with open('douban_2.txt', 'wb+') as f:
    f.write(r.content)

注意:User-Agent也用如上方式获取并复制到代码中

运行代码,即可在脚本文件目录下找到"douban_2.txt"的text文件,里面是豆瓣登录主页的源代码。

免责声明:文章转载自《python爬虫+使用cookie登录豆瓣》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇layui开关遇见的坑以及用法总结Html5的新特性总结下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

python 目录与文件的时间操作

在Python中,文件操作主要来自os模块,主要方法如下: os.listdir(dirname):列出dirname下的目录和文件os.getcwd():获得当前工作目录os.curdir:返回当前目录('.')os.chdir(dirname):改变工作目录到dirname os.path.isdir(name):判断name是不是一个目录,name不...

【转】Python 数据库连接池

    python编程中可以使用pymysql进行数据库连接及增删改查操作,但每次连接mysql请求时,都是独立的去请求访问,比较浪费资源,而且访问数量达到一定数量时,对mysql的性能会产生较大的影响。因此实际使用中,通常会使用数据库的连接池技术,来访问数据库达到资源复用。 python的数据库连接池包:DBUtils DBUtils提供两种外部接...

python 在不同层级目录import 模块的方法

有一个文件夹/home/a,  里面有个模块叫b.py,  我怎么把他import到程序里? 1). import sys; sys.path.append("/home/a/") import b 2). 在目录里面增加__init__.py文件,里面可以写import时执行的代码,当然也可以留空就可以. import home.a.b 3)....

Coverage测试代码覆盖(Python)

Coverage 测试代码执行率1、安装coverage 命令行:pip install coverage2、将测试代码放到一个盘符下,如:D:\test测试代码:Calc.py# coding=utf-8class Calc(object): def add(self, x, y, *d):# 加法计算result = x + yfor i in d:r...

Python排列组合

product 笛卡尔积  (有放回抽样排列) permutations 排列  (不放回抽样排列) combinations 组合,没有重复  (不放回抽样组合) combinations_with_replacement 组合,有重复  (有放回抽样组合) >>> importitertools >>> for i...

python自动控制windows、Android的软件用来实现机器人流程自动化--RPA,外挂、自动化测试等方面的解决方案

机器人流程自动化--RPA,外挂、自动化测试等方面要求的用脚本自动化操作各平台的软件,说白了就是基于图像识别和控件识别,模拟人工输入和点击操作来实现的,从而到达代替手动操作,降低劳动强度。一、windows系统:   方案一、组合以下库和软件来达到目的:      1、pyautogui库:模拟按键...