Python żąda wyodrębnienia ciała odpowiedzi HTTP

Python żąda wyodrębnienia ciała odpowiedzi HTTP
W tym artykule nauczy Cię, jak wyodrębnić ciało HTML z odpowiedzi HTTP za pomocą biblioteki żądań.

Instalowanie żądań

Przed przystąpieniem do tego samouczka upewnienie się, że pakiet żądań zainstalowany w środowisku jest dobry.

Możesz uruchomić polecenie, jeśli używasz PIP:

$ sudo pip żądania instalacji
$ sudo pip3 żądania instalacji

W przypadku użytkowników Anaconda możesz użyć polecenia:

$ sudo ceda instaluj -c żądania anakonda

Składanie żądania HTTP

Poniższy przykład pokazuje, jak korzystać z metody żądań, aby złożyć żądanie danego zasobu w Internecie.

żądania importu
Odpowiedź = żądania.Get ('http: // Google.com ')

Powyższy przykład rozpoczyna się od importowania pakietu żądań. Następnie składamy żądanie GET do określonego adresu URL. Powinno to zwrócić obiekt odpowiedzi, który zapisujemy w obiekcie odpowiedzi.

Wyodrębnij korpus HTML z obiektu odpowiedzi

Możemy użyć metody zawartości do wyodrębnienia ciała HTML z obiektu odpowiedzi, który zwraca zawartość odpowiedzi.

Przykładowy kod jest taki jak pokazano:

żądania importu
Odpowiedź = żądania.Get ('https: // Google.com ')
Drukuj (odpowiedź.treść)

Powyższe zapytanie powinno zwrócić ciało HTTP, jak pokazano:

Następnie możesz napisać wynikową zawartość HTML do pliku HTML.

Wniosek

W tym krótkim artykule nauczyłeś się korzystać z odpowiedzi.content () metoda wyodrębnia ciała HTML z obiektu odpowiedzi.