Downloader

Web Magic 总体架构

1.2 总体架构 WebMagic的结构分为Downloader、PageProcessor、Scheduler、Pipeline四大组件,并由Spider将它们彼此组织起来。这四大组件对应爬虫生命周期中的下载、处理、管理和持久化等功能。WebMagic的设计参考了Scapy,但是实现方式更Java化一些。 而Spider则将这几个组件组织起来,让它们可...

4K Video Downloader V6.1.50版本发布(解决B站视频下载问题)

近日,B站算法更新,部分用户反映很多哔哩哔哩视频无法下载,经测试,该问题在4K Video DownloaderV6.1.50版本已完美解决, 需要的用户可以尽快升级到最新版本,以免影响正常下载。除了下载B站视频,4K Video Downloader还支持下载音乐,下载字幕,合并字幕与视频,批量将在线视频转换成MP3, MP4, MOV, AVI......

网络爬虫+SQL注入检测一

项目目录结构 /w8ay.py //项目启动主文件 /lib/core //核心文件存放目录 /lib/core/config.py //配置文件 /script //插件存放 /exp //exp和poc存放 四、实验步骤 4.1 sql检测脚本编写 用一个字典存储数据库特征: DBMS_ERRORS = { # regular express...

Google图片下载利器Universal Maps Downloader的辅助工具(元宝)

最近做项目要用到卫片做底图,手头没有好的图片做多级缩放,只好借用“网络资源”。用过很多工具,个人觉得还是Universal Maps Downloader最好! 以下是Universal Maps Downloader的简单情况 UniversalMapsDownloader是一款可以从GoogleMaps,YahooMaps,MicrosoftMaps上...

爬虫(十五):scrapy中的settings详解

Scrapy设定(settings)提供了定制Scrapy组件的方法。你可以控制包括核心(core),插件(extension),pipeline及spider组件。设定为代码提供了提取以key-value映射的配置值的的全局命名空间(namespace)。 Scrapy内置设置 下面给出scrapy提供的常用内置设置列表,你可以在settings.py文...