Klasa RobotFileParser
Klasa RobotFileParser zapewnia różne metody czytania, analizowania i odpowiadania na pytania dotyczące robotów.plik txt w danym zasobie.
Obsługiwane metody obejmują:
Przykładowy przypadek użycia
Poniższy kod pokazuje użycie klasy RobotFileParser i dostarczonych metod.
importować urllib.RobotParser
rp = urllib.RobotParser.RobotFileParser ()
Rp.set_url ("https: // linuxhint.com/roboty.tekst")
Rp.Czytać()
req_rate = rp.request_rate („*”)
req_rate.sekundy
Rp.crawl_delay („*”)
Rp.can_fetch („*”, „https: // linuxhint.COM/Subskrypcja do-linuxhint-com/”)
Rp.can_fetch („*”, „https: // linuxhint.cOM/Subcribise-to-Linuxhint-Com/WP-Admin ”)
Powyższy kod zaczyna się od zaimportowania modułu RobotParser i utworzenia instancji klasy RobotFileParser.
Następnie przekazujemy adres URL robotom.plik txt i wyślij plik do parsera. Następnie używamy dostarczonych metod do wykonywania różnych działań.
Kod powyżej powinien zwrócić:
5
30
PRAWDA
FAŁSZ
Wniosek
W tym artykule omówiliśmy, jak korzystać z modułu RobotParser z pakietu Urllib, umożliwiającym wykonywanie różnych działań w robotach.plik txt. Zapraszam do zbadania kodu źródłowego, aby uzyskać więcej informacji.