KolumnyFrame DataFrame, z których każda może zawierać liczbę całkowitą, liczbę zmiennoprzecinkową lub ciąg, są reprezentowane na poziomie kolumny, ponieważ zawiera wiele wskaźników, a zatem domyślnie uwzględniając nie wartość. W związku z tym stopimy informacje za pomocą tego poziomu kolumny. Nazwa zmiennej jest reprezentacją określonej nazwy zmiennej używanej do stopienia kolumn. Ten elastyczny zwykle zawiera wartość skalarną i ma domyślną wartość non, ponieważ używa zmiennej używanej w tej konkretnej kolumnie do stopienia ramki danych.
Składnia funkcji Melt ()
„Value_vars” to reprezentacje istniejących nieutwardzonych kolumn. Większość kolumn jest zwracana i nie ustawiona jako „id_var”, jeśli nazwy kolumn nie są wskazane. Lista krotek lub ndarray może być używana jako te parametry wartości. Wszystkie sekcje używane jako zmienne identyfikatora są reprezentowane przez zmienną „id_vars”. Rama danych, która musi być przydzielona w pandy, jest wskazywana przez ramkę.
Przykład nr 1: Korzystając z funkcji Melt, możesz przekazać kilka kolumn jako parametr Value_VARS
Korzystając z pandy w Python, możemy zrestrukturyzować dane w bardziej przyjazną komputerowo formę, aby uprościć przetwarzanie danych tabeli. Należy wykonać funkcję imperatywną „stop ()”. Rzeka danych nie jest wyrównana z dużej wersji do zwykłego formatu przy użyciu „Pandy.stopić()". Początkowo tworzymy naszą strumień danych. DataFrame służy do przechowywania informacji w formacie dwuwymiarowym. Jest identyczny z tabelą, ponieważ dane są zapasowe w wierszach i kolumnach. Rekordy są reprezentowane przez wiersze i funkcje są reprezentowane przez kolumny.
W takim przypadku nazwa naszej ramki danych to „D1”, która ma trzy kolumny. „Nazwa” jest pierwszą kolumną w naszej ramce danych i dodatkowo zawarta jest lista niektórych nazw: „Thomas”, „Lily” i „Henry”. Druga kolumna, którą mamy, to „wiek”, który zawiera „25”, „29” i „31”. A w trzeciej kolumnie „zawód” mamy „inżynier”, „lekarz” i „księgowy”. Za pomocą „PD.DataFrame ”wyświetlimy ramkę danych na ekranie.
Teraz dodajmy funkcję „Melt ()” do naszej aplikacji. Zastosowano parametry funkcji „Melt ()” i „ID var” i „wartość var”. Aby użyć kolumny lub kolumn jako zmiennych identyfikatorów, użyj „id _var” i „value_var”, który jest drugim parametrem używanym w tym przykładzie, aby zdefiniować, gdzie zawartość zostanie stopiona i przechowywana w dodatkowych liniach. Tutaj używamy „int_var” w jednej kolumnie i „value_var” w wielu kolumnach. Używamy „value_var” w kolumnach „wiek” i „zawód” i „id_var” w kolumnie „Nazwa”. „PD.Melt ”służy do generowania ramki danych, a„ print (df_melted) ”wyświetli ramkę danych na ekranie.
W obrazie wyjściowym programu widoczne są dwie ramy danych. Za pomocą „PD.Funkcja DataFrame ”wygenerowaliśmy pierwszą ramkę danych, w której mamy trzy kolumny„ Nazwa ”,„ wiek ”i„ zawód ”. Stosując parametry „id_var” i „wartość _var” do „PD.Metoda melt () ”, generowana jest druga rama danych. „ID_VAR” jest stosowany w jednej kolumnie, która jest „nazwa”. Oznacza to, że kolumna będzie wyświetlana dokładnie tak, jak w przypadku jej wartości, a „wartość_var” jest używana w dwóch kolumnach „wiek” i „zawód”. Tworzy dwie kolumny w ramce danych, jedna jest „zmienna”, a druga to „wartość” w kolumnie wartości, nazwa kolumny jest wyświetlana.
Kluczowe narzędzie, które wybiera określone wiersze i kolumny danych z ramki danych, nazywa się indeksem panda. Jego zadaniem jest skonfigurowanie danych do szybkiego dostępu i organizacji. Jest również opisywany jako podgrupa. Indywidualna wartość indeksu jest nazywana etykietą, a wartości są zapisane w typu odważnym w indeksie. Początkowy rozmiar indeksu DataFrame to „3”, który waha się od „0 do 1”, a po zastosowaniu parametrów rozmiar indeksu wynosi „6”, który waha się od „0 do 5”.
Przykład 2: Korzystając z funkcji stopu, możesz przekazać kilka kolumn jako parametr int_vars
Zobacz, co się stanie, gdy określisz więcej niż jedną kolumnę dla opcji ID_VARS. Podobnie do ostatniego przykładu, ten stosuje „id_var” do wielu kolumn, podczas gdy „wartość_var” jest stosowana do jednej kolumny. W poprzednim programie „wartość_var” zastosowano do wielu kolumn, podczas gdy „ID_VAR” zastosowano do jednej kolumny.
Pierwszą rzeczą, którą robimy, jest skonstruowanie trzykolumnowej ramki danych. Nazwa kolumny to „Nazwa”, „Marks” i „Temat”. Nazwy w pierwszej kolumnie to „Ava”, „Isla” i „Leo”. W drugiej kolumnie mamy listę znaków „45”, „22” i „31”. W trzeciej kolumnie mamy nazwę tematu, w tym „Zarządzanie”, „Oop” i „Java”. Teraz „PD.DataFrame ”wygeneruje DataFrame, a„ Print (DF) ”wyświetli ramę danych na ekranie.
Uwzględnijmy teraz metodę „melt ()” do naszego kodu. Wykorzystano argumenty „id_var” i „wartość _var”. „Id_var” jest używany w dwóch kolumnach. „Nazwa” i „Znaki” i „Value_var jest używany w jednej kolumnie„ Temat ”. Aby utworzyć nową ramkę danych z wykorzystaniem informacji ze starej danych danych, użyj „PD.stopić". Teraz na ekranie zostanie wyświetlona na ekranie przez „Print (DF stoped)”.
Wynik funkcji „melt ()” z dwoma argumentami, które są „id_var” i „value_var”, jest wyświetlany na wyjściu. Stosując „ID_VAR” na dwóch kolumnach „Nazwa” i „Marks”, wyświetli swoje wartości, jak i jak zastosowaliśmy „wartość_var” do kolumny „podmiot”. Następnie jest podzielony na te dwie kolumny „zmienna” i „wartość”. W kolumnie „Zmienna” pokazuje nazwę kolumny „podmiot”, aw kolumnie „wartość” pokazuje wartości kolumny „podmiot”. Indeks ma wielkość „3”, od „0 do 2”.
Wniosek
Metoda „melt ()” w pandaach to wszechstronny sposób modyfikacji pandasframe. Nauczyliśmy się, jak korzystać z funkcji pand (melt () do konwersji Big Dataframe na długą, z ramką danych za pomocą prostego przypadku użycia. Powinieneś stale restrukturyzować część części w naszym materiale, zachowując przynajmniej jeden segment na miejscu jako wskaźniki. Funkcja „melt ()” w pandaas jest fantastycznym narzędziem do modyfikowania danych. Jeśli zarządzasz wieloma różnorodnymi informacjami ekonomicznymi i związanymi z pieniędzmi i potrzebujesz ich w bardziej przyjaznym dla baz danych, jest to szczególnie pomocne.