English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Python-Spider: Bildern von Baidu über Schlüsselwörter abrufen

使用工具:Python2.7 点击我下载

scrapy框架

sublime text3

一。搭建python(Windows版本)

 1.安装python2.7 ---然后在cmd中输入python,界面如下则安装成功

 2.集成Scrapy框架----输入命令行:pip install Scrapy

安装成功界面如下:

失败的情况很多,举例一种:

解决方案:

其余错误可百度搜索。

二。开始编程。

1.爬取无反爬虫措施的静态网站。例如百度贴吧,豆瓣读书。

例如-《桌面吧》的一个帖子https://tieba.baidu.com/p/2460150866?red_tag=3569129009

Python代码如下:

代码注释:引入了两个模块urllib和re。定义了两个函数,第一个函数是获取整个目标网页数据,第二个函数是在目标网页中获取目标图片,遍历网页,并且给获取的图片按照0开始排序。

Hinweis: Re-Modul Wissen:

Crawling-Bild-Effekt:

Der Standardpfad für das Speichern von Bildern ist im gleichen Verzeichnis wie das erstellte .py-Datei.

2.Crawling von Baidu-Bildern mit Anticrawling-Maßnahmen. Zum Beispiel Baidu-Bilder usw.

Zum Beispiel Suchen nach Schlüsselwörtern wie "Smiley" https://image.baidu.com/search/index#63;tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

Bilder werden mit einem Rollenlademechanismus geladen, zuerst werden die priorisierten30.

Der Code lautet wie folgt:

Code-Kommentare: Importieren4Module, das os-Modul wird verwendet, um den Speicherort zu spezifizieren. Die ersten beiden Funktionen sind wie oben beschrieben. Die dritte Funktion verwendet einen if-Befehl und eine tryException-Exzeption.

Der Crawling-Prozess ist wie folgt:

Crawling-Ergebnis:

Hinweis: Beim Schreiben von Python-Code sollte auf die Ausrichtung geachtet werden, und and kann nicht gleichzeitig Tab und Leerzeichen verwendet werden, da dies Fehler verursachen kann.

Das ist der gesamte Inhalt dieses Artikels. Hoffentlich bringt dieser Artikel Ihnen ein gewisses Maß an Hilfe bei Ihrem Lernen oder Ihrer Arbeit. Wir hoffen auch, dass Sie die Anleitung mehr unterstützen!

Erklärung: Der Inhalt dieses Artikels wurde aus dem Internet übernommen und gehört dem Urheberrecht des Urhebers. Der Inhalt wurde von Internetbenutzern freiwillig bereitgestellt und hochgeladen. Diese Website besitzt keine Eigentumsrechte und hat den Inhalt nicht manuell bearbeitet. Sie übernimmt auch keine rechtlichen Verantwortlichkeiten. Wenn Sie verdächtigen Urheberrechtsinhalte finden, sind Sie herzlich eingeladen, eine E-Mail an notice#w zu senden.3Hinweis: Bitte ersetzen Sie # durch @, wenn Sie eine E-Mail senden, um eine Meldung zu machen, und fügen Sie relevante Beweise bei. Sobald überprüft, wird die Website den verdächtigen Inhalt sofort löschen.

Vermutlich gefällt Ihnen