Web Magic 简介,magic power web

Web Magic 简介

摘要：

请点击查看文章预览http://webmagic.io/docs/，该页面基于gitbook构建。本文件遵循CC-BYNC协议。WebMagic的架构设计参考了Scrapy，目标是尽可能模块化，并反映爬虫的功能特点。扩展部分提供了一些方便的功能，例如注释模式编写爬虫。此外，WebMagic还包括一些外围扩展和正在开发的产品项目WebMagic avalon。

WebMagic in Action

Little book of WebMagic.

WebMagic是我业余开发的一款简单灵活的爬虫框架。基于它你可以很容易的编写一个爬虫。

这本小书以WebMagic入手，一方面讲解WebMagic的使用方式，另一方面讲解爬虫开发的一些惯用方案。

文章预览请点http://webmagic.io/docs/，页面基于gitbook进行构建。

本文档遵循CC-BYNC协议。

1.WebMagic概览

WebMagic项目代码分为核心和扩展两部分。核心部分(webmagic-core)是一个精简的、模块化的爬虫实现，而扩展部分则包括一些便利的、实用性的功能。WebMagic的架构设计参照了Scrapy，目标是尽量的模块化，并体现爬虫的功能特点。

这部分提供非常简单、灵活的API，在基本不改变开发模式的情况下，编写一个爬虫。

扩展部分(webmagic-extension)提供一些便捷的功能，例如注解模式编写爬虫等。同时内置了一些常用的组件，便于爬虫开发。

另外WebMagic还包括一些外围扩展和一个正在开发的产品化项目webmagic-avalon。

免责声明：文章转载自《Web Magic 简介》仅用于学习参考。如对内容有疑问，请及时联系本站处理。

Web Magic 简介

1.WebMagic概览

相关文章

WebMagic 抓取图片并保存至本地

webMagic入门案例，启动流程，及从页面中获取元素，并放到Page对象中，并成功拿出

WebMagic

Web Magic 总体架构

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表