Pandas Wybierz wiersz według indeksu

Justyna Flak

Wybór wierszy z ramki danych może być konieczne dla różnych zadań analizy danych. Podczas wybierania niektórych wierszy i ponownej próbkowania panów danych i serii zastosowano technikę pandów „ILOC []” do indeksowania opartego na liczbie całkowity.

Możesz go użyć, postępując zgodnie z podaną składnią:

Tylko dane wejściowe o wartości całkowitej są obsługiwane przez właściwość „ILOC []”. Te dane wejściowe można jednak przekazać na kilka sposobów.

Nauczysz się różnych podejść do substancji pandasframe przy użyciu właściwości „ILOC []” w tym samouczku.

Przykład 1:

Aby wybrać pojedynczy wiersz w ramce danych według indeksu, przyjrzymy się praktycznej demonstracji „DF.metoda ILOC [] ”dostarczona przez pandy.

Kompilacja i wykonanie przykładów zostanie przeprowadzone w narzędziu „Spyder”. Uruchomiliśmy więc narzędzie i szukaliśmy wymaganych bibliotek. Odkryliśmy, że zestaw narzędzi „pandy” jest tym, czego potrzebujemy z metodami wyboru wierszy. Biblioteka Panda jest importowana do programu, a „PD” jest ustawiony jako alias. Gdziekolwiek w kodzie musimy zadzwonić do pandy, użyć „PD” zamiast „Pandy”.

Pierwsze zastosowanie zestawu narzędzi pandy pojawia się, gdy musimy wygenerować pankazę danych pandas za pomocą „PD.Metoda dataFrame () ”. Nazywamy „PD.Funkcja dataFrame () ”i określ dla niej wartości. Chcieliśmy, aby utworzył ramkę danych o 3 kolumnach: „Góry”, „Wysokość” i „kontynent”. Wartości zostały zidentyfikowane dla każdej kolumny, a długość kolumny jest równa dla wszystkich kolumn.

Kolumna „Mountains” trzyma nazwy pasm górskich, które są „Karakoram”, „Hindu Kush”, „Alaska Range”, „Himalayas” i „Andów”. Druga kolumna „Wysokość” przechowuje długość w metrach tych pasm górskich. Wartości dla tej kolumny to „8611”, „7708”, „6194”, „8848” i „6961”. Ostatnia kolumna „Continent” ma nazwę kontynentu, w której znajdują się te góry: „Azja”, „Azja”, „N_America”, „Azja” i „S_America”.

Konstruktor danych DataFrame, gdy wywołuje, tworzy ramkę danych z dostarczonymi danymi. Ale jeśli nazwiemy to ponownie w tym samym programie z nowymi danymi, straci poprzedni. Dzieje się tak, ponieważ nie znajduje żadnej pamięci do umieszczenia ramki danych. Jesteśmy zobowiązani do stworzenia przestrzeni, aby ją zachować. Aby utrzymać ramkę danych, aby móc go później używać, stworzyliśmy obiekt DataFrame „Fakty”. Będzie przechowywać ramkę danych z określonymi kolumnami i wierszami.

Aby wyświetlić wynik, Python podaje nam prostą metodę, jaką jest metoda „print ()”. Po prostu przyjmuje wejście i pokazuje go na terminalu. Wejście może być funkcją, zmienną/obiektem, operacją matematyczną lub ciągiem do wyświetlenia. Ponieważ chcemy wyświetlić naszą nowo utworzoną ramkę danych, podaliśmy obiekt DataFrame „Fakty” jako dane wejściowe do metody Pythona „print ()”.

Aby wykonać skrypt, naciskaliśmy klucze „Shift+Enter”. Oto nasza oprawa danych z 3 kolumnami i 5 rzędami przedstawionymi na terminalu, który można zobaczyć w migawce poniżej.

Teraz zostanie zbadane pobieranie jednego wiersza w dostarczonej ramce danych. Wybór jest oparty na indeksie. W tym celu pandas DataFrame ma właściwość „DF.I loc[]". Tylko wartości całkowite można przekazać do tej metody wyboru.

Użyliśmy „DF.ILOC [] ”właściwość zaraz po wyświetleniu ramki danych. Nazwa naszego „Fakty” danych jest dostarczana z metodą „ILOC []”. Pomiędzy kwadratowymi nawiasami właściwości określono numer indeksu, który chcemy wyodrębnić. Tutaj podaliśmy numer indeksu „3”. Tak więc właściwość „ILOC []” zajrzy do „faktów” i wyszukiwać wiersz z indeksem nr 3. Będzie pasował do indeksu, który dostarczyliśmy do każdego indeksu DataFrame i wybierze wiersz równy numerowi indeksu wejściowego. Po odzyskaniu wiersza zostanie on umieszczony w zmiennej „pudełka”, którą stworzyliśmy, aby przechowywać wynik właściwości „ILOC []”. Wreszcie wynik zostanie pokazany na konsoli, wykorzystując metodę „print ()”.

Rząd z indeksem 3 jest pobierany. Możesz to zobaczyć na poniższym obrazku. Rząd z indeksem nr 3 ma górę o nazwie Himalayas, wysokość wynosi 8848, a kontynent jest Azja. Ponadto danych danych dla tego wspomnianego wiersza to „obiekt”.

Przykład nr 2:

Na powyższej ilustracji nauczyliśmy się wybierać pojedynczy wiersz według indeksu, wykorzystując właściwość Pandas DataFrame „ILOC []”. Ta instancja porozmawia o wyborze wielu wierszy w ramce danych według indeksu.

Zastosowaliśmy „DF.ILOC [] ”. W tym przypadku używamy wyżej wymyślonej ramki danych. Nazwa danych „Fakty” jest zapisywana z właściwością „ILOC []” i w jej operatorze indeksowym, użyliśmy innego kwadratowego wspornika do określania wielu indeksów. Jeśli nie dodasz 2nd kwadratowego wspornika, spowoduje to błąd. Indeksy, które wybraliśmy do wyświetlenia, to „0”, „2” i „4”. Więc wyodrębni wiersze 1, 3 i 5. Wynik zostanie przechowywany w „wielu” zmiennej. Funkcja „print ()” będzie wykazywać dane wyjściowe.

3 wybrane wiersze zostały wyświetlone na terminalu.

Oprócz wyboru wielu wierszy w ramce danych, możesz również wybrać, które kolumny powinny być wyświetlane za pomocą wierszy.

W kwadratowych nawiasach metody „ILOC []” zdefiniowaliśmy indeksy dla wierszy i indeksów kolumny do wybrania. W pierwszym operatorze indeksowym wspomnieliśmy o indeksach dla wierszy jako „1”, „2”, „3” i indeksach kolumnowych w drugim jako „0” i „2”. Wyjście jest prezentowane przy użyciu metody „print ()”.

W wyniku wynikającej z nich wybrano trzy rzędy z 2 kolumnami.

Przykład nr 3:

Ostatnia technika wykonania właściwości „ILOC []” jest wybór wierszy według wartości indeksu, zostanie wprowadzona do praktyki w tym przykładzie.

Jeśli chodzi o wybór dużej liczby wierszy w ramce danych przez wartości indeksu, określenie indeksów wierszy jeden po drugim, zwłaszcza w przypadku dużych zestawów danych. Tutaj właściwość Pandas DataFrame „ILOC []” umożliwia nam dostarczenie zakresu wartości.

Skorzystaliśmy z „DF.właściwość ILOC [] ”z ramką danych wygenerowaną w pierwszej instancji. Zakres wartości indeksu jest określony jako „1: 4”. Tutaj „1” jest początkowym numerem indeksu, a „4” to ostatnia wartość indeksu. Wybierze wartości między tym zakresem, w tym wartość indeksu początkowego, ale z wyłączeniem ostatniej określonej wartości indeksu. Zmienna „Zakres” jest tworzona w celu utrzymania wyjścia ”. Funkcja „print ()” jest wywoływana, aby pokazać wynik.

To daje nam ramkę danych, którą można zobaczyć na obrazie wyjściowym dołączonym poniżej.

Wniosek

W tym artykule omówiliśmy wybór wierszy w ramce danych za pomocą wartości indeksu. Wykorzystaliśmy pandas DataFrame „DF.ILOC [] ”, aby osiągnąć pożądane wyniki. Różne techniki stosowania właściwości „ILOC []” zostały wyjaśnione i wdrożone przy użyciu kodów przykładowych. Pierwszy przykład informuje nas o sposobie wyodrębnienia pojedynczego wiersza według indeksu, druga ilustracja pracowała nad wyborem wielu wierszy według indeksu i wybranych wierszy z określonymi kolumnami, a ostatnia instancja dała wyobrażenie o wprowadzeniu zakresu wartości indeksu.

Pyton

Jak sprawdzić, czy sznurek jest pusty w Pythonie

Funkcja „nie”, funkcja „len ()”, funkcja „strip ()”, operator „==”, metoda „__eq __ ()” lub „nie + s...

Pani Alicja Szafrański

System systemu Windows

Co to jest Windows Pakiet Manager

Menedżer pakietu Windows lub Wining to potężne narzędzie do instalowania i zarządzania pakietami opr...

Bertram Jóźwiak

Doker

Jaka jest różnica między Dockerem a Podmanem?

Docker używa architektury klient-serwer, podczas gdy Podman jest silnikiem Daemon mniej kontenerowym...

Renata Borowiec