Antworten decken auf
Wir haben ein Response-Objekt mit dem Namen response mit dem Inhalt einer geheimen Website geladen. Deine Aufgabe ist es, die URL und den Titel der Website mithilfe der response-Variable herauszufinden. Du hast in der letzten Lektion gelernt, wie du die URL findest. Um den Titel der Website zu finden, musst du Folgendes wissen:
- Der Titel ist der Text aus dem
title-Element - Das
title-Element ist ein Kind deshead-Elements, das wiederum ein Kind des Wurzelelementshtmlist.
Zu beachten: Das Wurzelelement html hat nur ein untergeordnetes head-Element, und das head-Element hat nur ein untergeordnetes title-Element.
Diese Übung ist Teil des Kurses
Web Scraping in Python
Anleitung zur Übung
- Weise der Variable
this_urldie URL zu, die zum Laden der Variableresponseverwendet wird. - Weise der Variable
this_titleden Titel der Website zu, die zum Laden der Variableresponseverwendet wird. Da wir nur den Text des einzelnen Elements, das wir auswählen wollen, benötigen, verwenden wir die Methodeextract_first(), um den Text zu extrahieren. - Unabhängig davon, ob du
xpathodercssverwendest, musst du darauf achten, dass du den Text innerhalb des Titelelements auswählst und nicht nur den Titel selbst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Get the URL to the website loaded in response
this_url = ____
# Get the title of the website loaded in response
this_title = response.____.extract_first()
# Print out our findings
print_url_title( this_url, this_title )