Scrape ist ein Begriff, der die Extraktion von Daten aus einer Website bezeichnet. Diese Aufgabe wird von einem Code ausgeführt, der "Scraper" genannt wird. Bei den Daten kann es sich um Text, Fotos, Videos, Kontaktinformationen oder Produktartikel handeln.
Scrape, auch Web Scraping oder Webdatenextraktion genannt, ist eine Technik zum Abrufen großer Datenmengen von einer Website. Anschließend werden die Daten auf einem Computer oder in einer Datenbank in einem Tabellenformat gespeichert.
Auch wenn das Scraping manuell durchgeführt werden kann, werden beim Scraping von Webdaten in der Regel automatisierte Tools verwendet, da dies ein schnellerer und weniger kostspieliger Prozess ist.
Web Scraping ist im Wesentlichen eine Form der Datenextraktion. Elemente wie Wetterberichte, Marktpreise oder jede andere Liste von gesammelten Daten können in Web Scraping Bemühungen gefunden werden.
Normalerweise wird Web-Scraping verwendet, wenn Suchmaschinen-Bots eine Website durchsuchen, um sie zu analysieren oder in eine Rangliste einzutragen, wenn Bots für Preisvergleiche eingesetzt werden oder wenn Marktforschungsunternehmen Scraper verwenden, um Daten aus Foren zu ziehen.
Die gesamte Arbeit wird von einem Scraper ausgeführt, der ein Stück Code ist.
Im ersten Schritt sendet er eine "get"-Code-Anfrage an die Website, die er auslesen möchte. Er kann so konfiguriert werden, dass er mit jeder beliebigen Website funktioniert, oder er kann für eine bestimmte Website erstellt werden.
Anschließend lädt und extrahiert die Web-Scraping-Software automatisch Daten von mehreren Seiten einer Website, je nach Anforderung.
Anschließend wird auf der Grundlage der Ergebnisse der Abfrage ein HTML-Dokument erstellt.
Im letzten Schritt werden die angeforderten Daten von den Scrapern in dem Dokument gesucht und die Ergebnisse in ein vom Benutzer zuvor festgelegtes Dokument umgewandelt. Mit einem einfachen Mausklick lassen sich die auf der Website verfügbaren Daten problemlos speichern.