Mapa Pandas DataFrame

Mapa Pandas DataFrame
Niezwykle szybka i skuteczna metoda zarządzania i eksploracji danych jest oferowana przez Pandas Library. Pandy mogą skutecznie łączyć różne zestawy danych, abyśmy nawet nie napotykają żadnych problemów podczas oceny danych. Pandy zapewnia serię, dykt i ramki danych. Kolumny DataFrame są również uważane za serię. Korzystamy z metody „map ()”, aby zwiększyć kolumnę i przypisać ją z powrotem do DataFrame. Metoda „map ()” jest wykorzystywana do mapowania wartości szeregowych na odpowiednie wejścia. Możemy również zmapować dwie serie tej samej długości. Nie stosujemy tej metody „map ()” do mapowania dwóch ram danych. W tym przewodniku badana jest metoda „map ()”, aby dowiedzieć się, jak ta metoda „mapy ()” działa w pandy.

Składnia:

# Seria.mapa (arg, na_action = brak)

Przykład 1:

Praktycznie używamy metody „map ()” w naszym kodzie pandy. Importujemy metodę zapewniającą Pandy z pomocą słowa kluczowego „Importuj” i ustawiamy „Pandy jako PD”. Pomaga nam to w naszym kodzie, w którym musimy uzyskać dostęp do metod Panand. Wkładamy tylko „PD”, aby to zrobić. Teraz ta lista lub seria, która jest tutaj utworzona, nazywa się „Score_data”.Wkładamy „First_name”, w tym „Emma, ​​Robert, Leonard, Howard i Jessica”. Następnie mamy „Last_name”, który zawiera „Edward, Samuel, Herry, William i Fowler”. Dodajemy „42, 36, 46, 45 i 39” na liście „wiek”.

Następnie mamy „Score_1 i Score_2”, w którym dodajemy odpowiednio „9, 8, 6, 7, 5” i „28, 45, 59, 62, 70”. Zmieniamy ten „score_data” na „score_df” i wspominamy „nazwa last_name, wiek, score_1 i score_2” jako kolumny. Tak więc jest ustawiony jako nagłówek DataFrame. Drukujemy „score_df” na terminalu. Następnie tworzymy słownik „podmiotów” i wstawiamy nazwy przedmiotów, wspominając nazwę pierwszej nazwy tematu. W słowniku dodajemy „komputer, chemia, matematyka, astronauta i nauka”, wspominając o „pierwszej nazwie” wraz z tym. Teraz mapujemy ten słownik na wspomniane wcześniej „score_df”.

Tworzymy nową kolumnę o nazwie „Tematy”. Wspominamy kolumnę „First_name” i wykorzystujemy metodę „map ()” do mapowania przedmiotów w tym „score_df”. Po odwzorowaniu kolumny tematycznej na „score_df” wyświetlamy „score_df”. Wyświetla to tylko wtedy, gdy używamy metody „print ()”.


Teraz kompilujemy i wykonujemy ten kod pandy w „Spyder”. Istnieją dwa sposoby wykonania tego kodu. Jednym z nich jest naciśnięcie klawiszy „Shift+ Enter”, a drugi to wykonanie kodu, klikając przycisk „Uruchom” aplikacji „Spyder”. Po wykonaniu otrzymujemy dane wyjście. Pierwsza ramka danych zawiera pięć kolumn. Mapujemy kolumnę do tego „score_df” za pomocą metody „map ()”, która jest również pokazana na następującej ilustracji:

Przykład 2:

Teraz rozpoczynamy nowy przykład od importowania „Pandy jako PD” i tworząc zagnieżdżoną listę, która nazywa się „AC_LIST”. Ta zagnieżdżona lista składa się z trzech kolumn o nazwie „AC_NAME, AC_NUM, dołączanie”. „AC_Name” mają nazwy „James, Melissa, Farnham, Samuel, Bromley, Coghill i Fuller”. „AC_NUM” zawiera liczby konta jako „AC4319, AC1234, AC3498, AC4525, AC4439, AC2624 i AC1501”. W dołączeniu dodajemy miesiąc dołączenia, które są „czerwca, kwietnia, maj, sierpień, luty, styczeń i grudzień”. „AC_LIST” jest zmieniany w ramkę danych „AC_DF”, ponieważ używamy „PD.Ramka danych". Umieściliśmy ten „AC_DF” do metody „print ()”. Jest renderowany podczas wykonywania kodu.

Następnie generujemy słownik i oszczędzamy go w „płciach”. Umieściliśmy płcie „męskie i żeńskie” dla tych danych, które wstawiliśmy na poprzedniej liście. Mapujemy również ten słownik na oprawę danych, którą utworzyliśmy. Aby zmapować „płcie” w tym „ac_df”, najpierw tworzymy nową kolumnę o nazwie „płeć”, wspominamy kolumnę „Pierwsze imię”, a następnie używamy metody „map ()”. W tej metodzie wstawiamy „płcie”. Wyświetlamy „ac_df” po mapowaniu kolumny „płeć”. Jest to wyświetlane tylko wtedy, gdy używamy metody „print ()”.


Otrzymujemy określone dane wyjściowe po uruchomieniu wyżej wspomnianego kodu. Trzy kolumny składają się na pierwszą ramkę danych. Następnie mapujemy kolumnę „Płeć” do tego „AC_DF” za pomocą techniki „map ()”, która jest również pokazana tutaj. Wyświetlane jest „NAN”, co wskazuje, że nie wstawialiśmy żadnej wartości.

Przykład 3:

W tym przykładzie tworzymy serię pandy po imporcie pandy. Generujemy tę serię pandy, używając „PD.Seria ”Metoda pandy. Ta „PD” uzyskuje dostęp do tej metody „serii”. Wkładamy niektóre dane do tej serii i zapisujemy serię w zmiennej „Zwierzęta”. Ta seria zawiera w niej „królik, krowa, szczur, pies, mysz i niedźwiedź”.

Następnie wyświetlamy tę serię. Po wyświetleniu serii „Zwierzęta” mapujemy linię do wszystkich wartości serii. Używamy metody „map ()” i wstawiamy „Jestem A ”. Włóż nazwę zwierząt jeden po drugim do tych kręconych aparatów ortodontycznych. Następnie wydrukuj je, co oznacza, że ​​wyświetla tę linię ze wszystkimi nazwami zwierząt. Renderuje serię po mapowaniu, ponieważ jest napisana w metodzie „print ()”.


Możesz zobaczyć, że nazwy zwierząt są renderowane w serii. Następnie mapuje linię, którą napisaliśmy wcześniej ze wszystkimi nazwami zwierząt i drukuje ciąg „Jestem A” ze wszystkimi nazwami zwierząt.

Przykład 4:

Teraz importujemy pand i bibliotekę Numpy, ponieważ w tym przykładzie używamy funkcji lub metody zarówno pandy, jak i Numpy. Generujemy „C_List”, który zawiera „C_FEE” i „C_DUR”. W „C_fee” umieściliśmy „22000, 25000, 23000, NP.Nan i 26000 ”. Tutaj „NP.Nan ”oznacza, że ​​otrzymujemy tę wartość z biblioteki Numpy. Następnie umieszczamy dane w „C_DUR”, które są „20 dni, 50 dni, 40 dni, 35 dni i 45 dni”. Ta „c_list” jest przekonwertowana na „C_DF”.

Następnie stosujemy niektóre funkcje w tej metodzie „map ()”. Używamy tutaj metody „lambda” i zastępujemy 10% wartościami „c_fee”. Jest to zapisane w innej kolumnie, którą dodaliśmy tutaj z nazwą „Opłata”. Mapujemy tę „Opłatę” z kolumną „C_fee”. Następnie używamy metody „print ()”. „C_DF” jest wyświetlany po odwzorowaniu kolumny „płci”.


Pojawiły się tutaj dwie kolumny przed mapowaniem. Po zastosowaniu metody „map ()”, nowa kolumna „opłata” jest wstawiana do tych dwóch kolumn. Wyświetla wartość po zastąpieniu 10% z wartości „c_fee”. Zamiast „nan”, renderuje także „nan” w kolumnie „opłaty”, ponieważ w „c_fee” nie ma wartości, do której stosowane są obliczenia.

Wniosek

Głównym celem tego przewodnika jest dostarczenie bardzo dobrze, łatwych i opisowych informacji o funkcji „map ()” w pandy.Ten przewodnik wyjaśnił pojęcie funkcji „map ()” w dobrze wychowany sposób. Pokazaliśmy, jak użyć funkcji „map ()” w kodach tutaj. Jak wyjaśniliśmy, metoda „map ()” służy do mapowania wartości serii na odpowiadające im wejścia. Zilustrowaliśmy cztery przykłady w tym przewodniku, w którym zastosowaliśmy metodę „map ()”. Po dokładnym naukę tego przewodnika mamy nadzieję, że będziesz mógł łatwo wykorzystać tę metodę „map ()” w pandy.