Ćwiczenia pand do nauki

Ćwiczenia pand do nauki
Moduł „pand” jest najważniejszym narzędziem dostępnym dla analityków danych i badaczy Pythona. Biblioteka analizy danych Python Pandas koncentruje się głównie na danych tabelarycznych. Jest to bezpłatna i open source biblioteka dystrybuowana na podstawie licencji BSD. Pandy mają tak wiele aplikacji, że łatwiej jest wymienić to, czego nie mogą osiągnąć niż to, co mogą.

Ma przede wszystkim dwie formy: serie i danych danych. „Seria” przechowuje dane dotyczące jednej zmiennej i można je wyświetlić jako wektor z indeksowanymi informacjami, podczas gdy „DataFrame” jest tabelarną strukturą danych.

W tym samouczku krótko przejdziemy przez niektóre z najczęściej używanych ćwiczeń pand dla początkujących. Otrzymasz migawkę skryptu Pythona z odpowiednim wyjściem dla każdego ćwiczenia.

Biblioteka importu

Aby rozpocząć pracę nad ćwiczeniami panda, najpierw musimy załadować bibliotekę „Pandy” do naszego pliku projektu. Narzędziem, którego używamy do wdrażania ćwiczeń pandy, jest „Spyder”. Uruchomiliśmy narzędzie i załadowaliśmy bibliotekę pandy do pliku Python, pisząc skrypt „Importuj pandy jako PD”. Mamy pandę aliasową jako „PD”. Teraz „PD” może być używane zamiast „pandy” w całym programie.

Ćwiczenie nr 1: Przekształcenie listy w serię

Pierwszym ćwiczeniem, którego postanowiliśmy nauczyć, jest generowanie serii pandy z listy.

Stworzyliśmy zmienną „manekin” i przypisaliśmy jej listę wartości jako „1”, „2”, „3”, „4”, „5”, „6” i „7”. Przywołaliśmy „PD.Seria () ”funkcja i przekazała do niej listę„ manekina ”jako parametr. Powstała seria będzie przechowywana w zmiennej „Konwertuj”. Aby pokazać zawartość na ekranie, pandy dostarczają nam metody „print ()”. Wyświetliśmy serię „Konwertuj” wykorzystującą funkcję „print ()”.

Odpowiednia migawka wyjściowa pokazuje, że seria została wygenerowana z domyślnymi indeksami.

Ćwiczenie nr 2: Przekształcenie listy na serię za pomocą określonych indeksów

Pierwsze ćwiczenie precyzyjnie wykazało konwersję listy w serię pandy. Widzieliśmy na obrazie wyjściowym, że lista została przedstawiona z domyślną listą indeksów. Jeśli nie chcesz, aby Twoja seria była wyświetlana z tymi indeksami, możesz ją zmienić, podając określone indeksy.

Użyliśmy listy z powyższej instancji. Aby przekonwertować listę na serię i zdefiniować indeksy, nazywaliśmy „PD.Funkcja serii () ”. Dwa parametry zostały przekazane do tej funkcji: List_name i indeks. Nazwa listy „manekina” jest dostarczana. Argument „indeks” służy do zmiany domyślnej listy indeksu z tą, którą podał użytkownik. Dostosowaliśmy listę indeksów do wartości „A”, „B”, „C”, „D”, „E”, „F” i „G”. Seria z zaktualizowaną listą indeksu jest przechowywana w zmiennej „Konwertuj”, a następnie wystawiana za pomocą funkcji „print ()”.

Na wynikającym obrazie domyślne indeksy zostały zastąpione przez dostarczoną przez użytkownika listę indeksów.

Ćwiczenie nr 3: Przekształcenie list w ramkę danych

W pierwszym ćwiczeniu nauczyliśmy się przekształcać listę w serię pandy. Teraz zobaczymy, jak przekonwertować listy na pandas DataFrame.

W skrypcie wygenerowano trzy listy. Listy te mają wartości „[„ Harry ”, 25,„ Inżynier ”]”, „[„ Roma ”, 32,„ Doctor ”]” i „[„ Elizia ”, 22,„ artysta ”]”. Zapisaliśmy te listy w obiekcie listy 2D „L1”. Teraz, aby przekonwertować „L1” na pandy danych, mamy funkcję pandas „PD.Ramka danych()". Ta funkcja została wywołana, a lista 2D jest podana jako parametr wraz z innym parametrem „kolumny”. DataFrame pokazuje dane w postaci tabel mających wiersze i kolumny, więc parametr „kolumny” umieści etykiety w kolumnach DataFrame. Każda lista ma 3 wartości, co oznacza, że ​​będziemy mieli 3 kolumny w DataFrame. Określiliśmy etykiety jako „imię”, „wiek” i „zawód”. DataFrame jest przechowywana w obiekcie DataFrame „Demo”.

Wykonanie programu daje nam ramkę danych z 3 kolumnami z określonymi etykietami i wartościami wygenerowanymi z dostarczonej listy 2D.

Ćwiczenie nr 4: Przekształcenie słownika na DataFrame

Słownik PandaS to zbiór list. Aby nauczyć się konwersji dyktmy na ramkę danych, najpierw musimy stworzyć słownik. Utworzono słownik „próbka” z 3 listami wartości. Pierwsza lista „col1” ma wartości „Harry”, „Roma” i „Elizia”. Lista „Col2” przechowuje dane „25”, „32” i „22”. Lista „col3” ma wpisy „inżyniera”, „lekarza” i „artysty”. Aby skonstruować ramkę danych z „DICT_DICT”, wywołaliśmy „PD.Metoda dataFrame () ”i przekazała słownik jako parametr. Kiedy „PD.Metoda dataFrame () ”, przyjmie treść słownika i zmodyfikuje ją do DataFrame. Konwertowana ramka danych jest przechowywana w obiekcie DataFrame „Zmień” i jest wyświetlany na konsoli za pomocą metody „print ()”.

Ten program po wykonaniu, daje nam dane wyjściowe pokazane w poniższej migawce.

Ćwiczenie nr 5: Określenie indeksu w DataFrame

Kiedy pokazujemy ramkę danych lub serię na terminalu, jest on przede wszystkim wyposażony w domyślną listę indeksu, która zaczyna się od „0” do długości zestawu danych. Nauczyliśmy się zmieniać w serii i możesz go również zmodyfikować w ramce danych.

Wykorzystaliśmy ramę danych wygenerowaną w powyższym ćwiczeniu. Widać, że DataFrame ma indeks „0”, „1” i „2”. Zmienimy to domyślne zachowanie, podając naszą listę indeksu. Między aparatem ortodontyczny „PD.Metoda dataFrame () ”, podana jest nazwa słownika„ próbka_dict ”i„ indeks ”. Indeksy zostały określone jako „x”, „y” i „z”.

Rama danych z zaktualizowaną listą indeksu jest wyświetlana na ekranie.

Ćwiczenie nr 6: Wyodrębnienie określonej kolumny w ramce danych

Aby wybrać konkretną kolumnę w ramce danych, użyjemy poprzedniej ramki danych z domyślnymi indeksami. Po wydrukowaniu początkowej ramki danych, użyliśmy „DF.Metoda loc [indeks, kolumna] ”. Ponieważ chcemy wybrać kolumnę, opuściliśmy miejsce „indeks”, dostarczając w niej „:” i podaliśmy nazwę kolumny „col2” między jej nawiasami. Wybrana kolumna jest przechowywana w zmiennej „Wybierz” i przedstawiona za pomocą funkcji „print ()”.

To jest wynik powyższego skryptu:

Ćwiczenie nr 7: Wyodrębnienie poszczególnych wierszy w ramce danych

Niektóre rzędy można również wybrać w ramce danych, postępując zgodnie z tą samą techniką, jak w przypadku wyboru kolumny z jednym wyjątkiem. Do wyboru wiersza musimy podać indeks w „PD.Metoda loc [] ”i umieść okrężnicę„: ”w miejscu kolumny. Wybrane przez nas wiersze to „1” i „2”.

Dwa wybrane rzędy zostały wystawione.

Ćwiczenie nr 8: Wypełnianie brakujących wartości w ramce danych

Utworzyliśmy ramkę danych z niektórymi brakującymi wartościami i wydrukowaliśmy na ekranie. Aby wypełnić te wartości, wywołaliśmy „DF.metoda Fillna () ”. Wartość, którą chcemy zostać zastąpiona wpisami zerowymi, wynosi „0”. Więc umieściliśmy go w „DF.Follna () ”. Zmienna „wypełnienie” przechowuje wynik, a metoda „print ()” wyświetli go.

Tutaj możesz zobaczyć, że wartości zerowe są teraz zastąpione 0.

Wniosek

Pandy zapewniają nam ogromną różnorodność opcji w celu rozwiązania rzeczywistych problemów z analizą danych. Działa głównie z ramami danych i seriami. W tym artykule omówiono niektóre najczęstsze ćwiczenia dotyczące funkcji szeregowych pandy, a także funkcji DataFrame Pandas. Opracowaliśmy 8 podstawowych technik uczenia się pandy. Pojęcia są rozumiane poprzez praktyczną demonstrację skryptu Pythona na narzędziu Spyder. Wszystkie te ćwiczenia są najlepszym przewodnikiem dla początkujących, aby rozpocząć od Python Pandas DataFrame i serie.