青青草免费线看线看|啊在车上停不下来了|国产少女免费观看电视剧|仑乱88MAV|精品老司机在线观看视频|国产一区二区三区高清免费视频|在线观看免费777av

python爬蟲萬能代碼 網絡爬蟲軟件有哪些


在上一篇文章《神器!五分鐘完成大型爬蟲項目!》,我們介紹了一個類似于 Scrapy 的開源爬蟲框架——feapder,并著重介紹了該框架的一種應用——AirSpider,它是一個輕量級的爬蟲 。
接下來我們再來介紹另一種爬蟲應用——Spider,它是是一款基于 redis 的分布式爬蟲,適用于海量數據采集,支持斷點續爬、爬蟲報警、數據自動入庫等功能 。
安裝 和 AirSpider 一樣,我們也是通過命令行安裝 。
由于 Spider 是分布式爬蟲,可能涉及到多個爬蟲,所以最好以項目的方式來創建 。
創建項目 我們首先來創建項目:

feapder create -p spider-project
創建的項目目錄是這樣的:
創建好項目后,開發時我們需要將項目設置為工作區間,否則引入非同級目錄下的文件時,編譯器會報錯 。
設置工作區間方式(以pycharm為例):項目->右鍵->Mark Directory as -> Sources Root 。
創建爬蟲 創建爬蟲的命令行語句為:
feapder create -s
AirSpider 對應的 spider_type 值為 1Spider 對應的 spider_type 值為 2BatchSpider 對應的 spider_type 值為 3默認 spider_type 值為 1 。
所以創建 Spider 的語句為:
feapder create -s spider_test 2
運行語句后,我們可以看到在 spiders 目錄下生成了 spider_test.py 文件 。
對應的文件內容為:
im

    猜你喜歡