Pandy upuszczają rząd

Pandy upuszczają rząd
W ramach zestawów danych Python inżynierowie oczyszczają dane w razie potrzeby do zadania. Funkcja upuszcza jest często wykorzystywana do eliminowania kolumn i wierszy, które mogą nie być istotne dla zadania.

Funkcja kropli pandy:

Metoda „Drop ()” w PandaS DataFrame usuwa dostarczone etykiety z kolumn i wierszy. Funkcja Drop () eliminuje wiersze i kolumny albo określając nazwy etykiet, a także odpowiednie osie lub poprzez jawne podając wskaźniki lub nazwy kolumn.

Kiedy używamy wielu indeksu, eliminujemy etykiety na różnych poziomach, wskazując poziom. Jest wykorzystywany do usunięcia ramki danych, której nie musimy uwzględniać w naszej analizie.

Składnia tej funkcji jest następująca:


Funkcja „Drop ()” zawiera łącznie siedem parametrów, z których niektóre są opcjonalne. Omówmy krótko wszystkie parametry.

Pierwszy parametr „Etykiety” jest albo indeksem, albo raczej nazwa kolumny, którą należy wyeliminować. Zazwyczaj jest to jako pojedyncza etykieta lub lista. "oś" ma dwie możliwe wartości: 0 i 1. Kiedy musimy zejść z indeksu/wierszu, piszemy 0 w parametrze, a jeśli musimy usunąć z kolumn, umieszczamy 1. Domyślnie jest ustawiony na 0. "indeks" może być używane zamiast określania osi (etykiety, oś = 0 jest równe indeksowi = etykiety).

Następny parametr to „Kolumny”. Służy do określenia kolumn. Indeksy i kolumny są równoważnikami osi, których nie można użyć w połączeniu. „Poziomy” jest opcjonalnym argumentem za użyciem wieluindex i określa poziom, z którego etykiety zostałyby upuszczone. "w miejscu" jest boolowskim argumentem, który, jeśli jest prawdziwy, wykonuje funkcję na miejscu i nie zwraca. Jego domyślne ustawienie jest fałszywe. Ostatni parametr to „Błędy”. Kiedy jest skonfigurowany do „ignorowania”, tylko istniejące etykiety są odrzucane, a błąd jest ignorowany. Ma dwie możliwe wartości. Pierwszy to „Ignoruj”, a drugi to „podniesienie”. Domyślnie jest ustawiony na „podniesiony”.

W tym artykule zademonstrujemy jego praktyczne wdrożenie z przykładowymi kodami. Spójrzmy, jak możemy to zrobić w Python.

Przykład nr 1: Wykorzystanie metody pandy () do upuszczenia pojedynczego wiersza według indeksu

Na tej ilustracji dowiemy się, aby upuścić pojedynczy wiersz według indeksu dostarczonej ramki danych za pomocą pand „DataFrame.metoda upuści () ”.

Aby rozpocząć praktyczną implementację kodu Pythona w celu wdrożenia „DataFrame.Funkcja Drop () ”W ramach danych Pandas musimy najpierw wybrać dobre narzędzie lub oprogramowanie, które może uruchomić nasze programy Python. Tutaj wybraliśmy i pobraliśmy narzędzie „Spyder”. Zainstalowaliśmy konfigurację narzędzia „Spyder”, a następnie uruchomiliśmy narzędzie. Po zobaczeniu interfejsu narzędzia „Spyder” otwórz nowy plik, klikając opcję „Nowy plik” lub naciskając klawisze „Ctrl+N”. Uruchomi nowy plik Python z rozszerzeniem „.Py ”, który odnosi się do„ Pythona ”. Mamy teraz wszystko do pracy.

Główny kod rozpoczyna się ładowaniem niezbędnych bibliotek do programu Python. Jak opisuje tytuł naszego artykułu, będziemy pracować nad niektórymi modułami na „Pandy”. Z tego więc rozumiemy, że naszym warunek wstępnym wdrożenia tego kodu jest import biblioteki „Pandy” do pliku Python. Aby to zdobyć, musimy napisać skrypt Python „Importuj pandy jako PD”. Pozwoli nam to korzystać z funkcji pandy w naszym programie i umożliwia nam dostęp do nich za pomocą „PD” zamiast „pandy” za każdym razem. Teraz musimy utworzyć ramkę danych pandy. Pandy z bardzo prostą metodą tworzenia ramki danych, czyli „PD.Ramka danych()".

Tutaj „PD” to pandy, a „DataFrame” jest słowem kluczowym do utworzenia ramki danych. Konstruowaliśmy ramkę danych, która zawiera trzy kolumny: „produkt”, „koszt” i „ilość”. Wszystkie te kolumny zostały przypisane niektóre wartości. Kolumna „Produkt” ma wartości ciągów, które są „Phone”, „Laptop”, „CPU”, „Printer”, „Mysz”, „Klawiatura” i „Głośnik”. Kolumny „kosztu” przechowują wartości całkowitej „5000”, „7000”, „4300”, „8150”, „1050”, „2150” i „1500”. Ostatnia kolumna „Ilość” zawiera wartości „3”, „2”, „1”, „5”, „1”, „2” i „4”. Należy pamiętać, tworząc ramkę danych, że wszystkie kolumny w ramce danych muszą mieć ten sam rozmiar lub długość wartości.

Mamy więc wszystkie kolumny o długości siedmiu. Aby przechowywać tę ramkę danych, utworzyliśmy obiekt ramy danych „Electronics” i przypisaliśmy go wyjście wygenerowane z wywoływania „PD.Funkcja dataFrame () ”. Wreszcie, aby wyświetlić tę ramkę danych, zastosowaliśmy metodę „print ()”, podając obiekt „elektroniki” jako jego parametr, aby teraz wydrukował dowolną zawartość przechowywaną w tym obiekcie ramki danych.


Aby wykonać wyżej napisany program Python, musimy nacisnąć przycisk „Uruchom plik” w narzędziu „Spyder” lub możesz również nacisnąć klawisze „Shift+Enter”, aby uruchomić skrypt. Mamy ramkę danych z trzema kolumnami i siedmioma wartościami wyświetlanymi na terminalu.


Stąd zaczyna się nasze główne zadanie. Musimy teraz dowiedzieć się, w jaki sposób możemy upuścić pojedynczy wiersz według indeksu za pomocą pand „DataFrame.metoda upuści () ”. Musimy po prostu podać nazwę ramki danych, które stworzyliśmy powyżej z „.Funkcja Drop () ”, a ponieważ musimy upuścić wiersz, zatem parametr, którego tu użyliśmy, to„ indeks ”. Podaliśmy numer indeksu „3”, który chcieliśmy wyeliminować z ramki danych. To usunie cały wiersz z „indeksem = 3”.

Aby przechowywać dane wyjściowe tej funkcji, utworzyliśmy zmienną „new_electronics”. Nazwaliśmy metodą „print ()” do wyświetlania tekstu określonego między jego nawiasami, a następnie wyświetlaliśmy zaktualizowaną ramkę danych zapisaną w zmiennej „new_electronics”, wywołując metodę „print ()”.


Uruchamianie wyżej wymieniony fragment kodu przyniesie nam zaktualizowaną ramkę danych po upuszczeniu trzeciego wiersza z wcześniej wygenerowanej ramki danych.


W tym obrazie wyjściowym widać, że trzeci wiersz jest eliminowany z ramki danych.

Przykład nr 2: Wykorzystanie metody pandy () do upuszczenia wielu wierszy według indeksu

Nauczyliśmy się już eliminować pojedynczy wiersz z ramki danych za pomocą pand „DataFrame.metoda upuści () ”. Teraz zobaczymy, co możemy zrobić, jeśli będziemy musieli odrzucić więcej niż jeden wiersz od ramki danych. Do tej ilustracji wykorzystaliśmy ramkę danych utworzoną w powyższym przykładzie. Będziemy bezpośrednio pracować nad głównym zadaniem, ponieważ wszystkie inne rzeczy zostały wyjaśnione w powyższym przypadku. Do upuszczenia wielu wierszy wykorzystaliśmy „DataFrame.Drop () ”funkcjonuje jako„ elektronika.Drop () ”, który jest nazwą naszej wcześniej utworzonej ramki danych.

Użyliśmy parametru „indeks” i przypisaliśmy mu liczby indeksów, które chcemy zrzucić z ramki danych jako „indeks = [1, 3, 5]”, co oznacza, że ​​musieliśmy odrzucić wiersze „1”, „3” oraz „5” z ramki danych. Następnie po prostu wywołujemy metodę „print ()”, aby wyświetlić zaktualizowaną ramkę danych.


Daje nam to następujące dane wyjściowe, w których wiersze 1, 3 i 5 są eliminowane z ramki danych.

Wniosek:

Ten przewodnik opisuje i opracowuje moduł Panda „DataFrame.Drop () ”, aby upuścić wiersze z ramki danych. Zdefiniowaliśmy i krótko wyjaśniliśmy różne parametry tej funkcji. Wprowadziliśmy Cię do pojęcia porzucenia pojedynczego wiersza według indeksu z ramki danych, a także usunięcie wielu wierszy według indeksu. Wdrożyliśmy obie koncepcje praktycznie z kodami Python na narzędziu „Spyder” i wyświetliśmy wynikające z nich ramki danych wygenerowane z programów. Ten kawałek pisania jest tylko przewodnikiem, ale Twoja praktyka z praktycznymi kodami sprawi, że będzie to Twoja umiejętność.