Pandy topnieją

Pandy topnieją
Panda to ramy statystyczne zatwierdzone przez Pythona. Przed wynalezieniem pandy większość naukowców użyła Pythona do rabowania i przygotowania informacji przed przejściem do bardziej specjalnego dialektu, takiego jak „R”, w celu równowagi ich procesu. Serie oferowane pandy, które zapewniają układ rankingowy, oraz struki danych, które mają zestaw tabeli. Te dwa nowe typy obiektów służą do przechowywania informacji, które ułatwiają operacje analityczne i eliminują potrzebę przesyłania narzędzi do przesyłania. Funkcja pand „stop ()” służy do opisania obiektu Frame, który jest wytwarzany w określony sposób z jedną lub więcej kolumnami działającymi jako identyfikatory zmieniające się w formacie zestawu danych z rozległych na długie. Tylko dwie kolumny są konfigurowalne i wartości, podczas gdy wszystkie inne kolumny są uważane za wartości i niezmienione w osi wiersza. Kiedy Python obsługuje dane wyjaśniające, używasz tej funkcji.

KolumnyFrame DataFrame, z których każda może zawierać liczbę całkowitą, liczbę zmiennoprzecinkową lub ciąg, są reprezentowane na poziomie kolumny, ponieważ zawiera wiele wskaźników, a zatem domyślnie uwzględniając nie wartość. W związku z tym stopimy informacje za pomocą tego poziomu kolumny. Nazwa zmiennej jest reprezentacją określonej nazwy zmiennej używanej do stopienia kolumn. Ten elastyczny zwykle zawiera wartość skalarną i ma domyślną wartość non, ponieważ używa zmiennej używanej w tej konkretnej kolumnie do stopienia ramki danych.

Składnia funkcji Melt ()

„Value_vars” to reprezentacje istniejących nieutwardzonych kolumn. Większość kolumn jest zwracana i nie ustawiona jako „id_var”, jeśli nazwy kolumn nie są wskazane. Lista krotek lub ndarray może być używana jako te parametry wartości. Wszystkie sekcje używane jako zmienne identyfikatora są reprezentowane przez zmienną „id_vars”. Rama danych, która musi być przydzielona w pandy, jest wskazywana przez ramkę.

Przykład nr 1: Korzystając z funkcji Melt, możesz przekazać kilka kolumn jako parametr Value_VARS

Korzystając z pandy w Python, możemy zrestrukturyzować dane w bardziej przyjazną komputerowo formę, aby uprościć przetwarzanie danych tabeli. Należy wykonać funkcję imperatywną „stop ()”. Rzeka danych nie jest wyrównana z dużej wersji do zwykłego formatu przy użyciu „Pandy.stopić()". Początkowo tworzymy naszą strumień danych. DataFrame służy do przechowywania informacji w formacie dwuwymiarowym. Jest identyczny z tabelą, ponieważ dane są zapasowe w wierszach i kolumnach. Rekordy są reprezentowane przez wiersze i funkcje są reprezentowane przez kolumny.

W takim przypadku nazwa naszej ramki danych to „D1”, która ma trzy kolumny. „Nazwa” jest pierwszą kolumną w naszej ramce danych i dodatkowo zawarta jest lista niektórych nazw: „Thomas”, „Lily” i „Henry”. Druga kolumna, którą mamy, to „wiek”, który zawiera „25”, „29” i „31”. A w trzeciej kolumnie „zawód” mamy „inżynier”, „lekarz” i „księgowy”. Za pomocą „PD.DataFrame ”wyświetlimy ramkę danych na ekranie.

Teraz dodajmy funkcję „Melt ()” do naszej aplikacji. Zastosowano parametry funkcji „Melt ()” i „ID var” i „wartość var”. Aby użyć kolumny lub kolumn jako zmiennych identyfikatorów, użyj „id _var” i „value_var”, który jest drugim parametrem używanym w tym przykładzie, aby zdefiniować, gdzie zawartość zostanie stopiona i przechowywana w dodatkowych liniach. Tutaj używamy „int_var” w jednej kolumnie i „value_var” w wielu kolumnach. Używamy „value_var” w kolumnach „wiek” i „zawód” i „id_var” w kolumnie „Nazwa”. „PD.Melt ”służy do generowania ramki danych, a„ print (df_melted) ”wyświetli ramkę danych na ekranie.

W obrazie wyjściowym programu widoczne są dwie ramy danych. Za pomocą „PD.Funkcja DataFrame ”wygenerowaliśmy pierwszą ramkę danych, w której mamy trzy kolumny„ Nazwa ”,„ wiek ”i„ zawód ”. Stosując parametry „id_var” i „wartość _var” do „PD.Metoda melt () ”, generowana jest druga rama danych. „ID_VAR” jest stosowany w jednej kolumnie, która jest „nazwa”. Oznacza to, że kolumna będzie wyświetlana dokładnie tak, jak w przypadku jej wartości, a „wartość_var” jest używana w dwóch kolumnach „wiek” i „zawód”. Tworzy dwie kolumny w ramce danych, jedna jest „zmienna”, a druga to „wartość” w kolumnie wartości, nazwa kolumny jest wyświetlana.

Kluczowe narzędzie, które wybiera określone wiersze i kolumny danych z ramki danych, nazywa się indeksem panda. Jego zadaniem jest skonfigurowanie danych do szybkiego dostępu i organizacji. Jest również opisywany jako podgrupa. Indywidualna wartość indeksu jest nazywana etykietą, a wartości są zapisane w typu odważnym w indeksie. Początkowy rozmiar indeksu DataFrame to „3”, który waha się od „0 do 1”, a po zastosowaniu parametrów rozmiar indeksu wynosi „6”, który waha się od „0 do 5”.

Przykład 2: Korzystając z funkcji stopu, możesz przekazać kilka kolumn jako parametr int_vars

Zobacz, co się stanie, gdy określisz więcej niż jedną kolumnę dla opcji ID_VARS. Podobnie do ostatniego przykładu, ten stosuje „id_var” do wielu kolumn, podczas gdy „wartość_var” jest stosowana do jednej kolumny. W poprzednim programie „wartość_var” zastosowano do wielu kolumn, podczas gdy „ID_VAR” zastosowano do jednej kolumny.

Pierwszą rzeczą, którą robimy, jest skonstruowanie trzykolumnowej ramki danych. Nazwa kolumny to „Nazwa”, „Marks” i „Temat”. Nazwy w pierwszej kolumnie to „Ava”, „Isla” i „Leo”. W drugiej kolumnie mamy listę znaków „45”, „22” i „31”. W trzeciej kolumnie mamy nazwę tematu, w tym „Zarządzanie”, „Oop” i „Java”. Teraz „PD.DataFrame ”wygeneruje DataFrame, a„ Print (DF) ”wyświetli ramę danych na ekranie.

Uwzględnijmy teraz metodę „melt ()” do naszego kodu. Wykorzystano argumenty „id_var” i „wartość _var”. „Id_var” jest używany w dwóch kolumnach. „Nazwa” i „Znaki” i „Value_var jest używany w jednej kolumnie„ Temat ”. Aby utworzyć nową ramkę danych z wykorzystaniem informacji ze starej danych danych, użyj „PD.stopić". Teraz na ekranie zostanie wyświetlona na ekranie przez „Print (DF stoped)”.

Wynik funkcji „melt ()” z dwoma argumentami, które są „id_var” i „value_var”, jest wyświetlany na wyjściu. Stosując „ID_VAR” na dwóch kolumnach „Nazwa” i „Marks”, wyświetli swoje wartości, jak i jak zastosowaliśmy „wartość_var” do kolumny „podmiot”. Następnie jest podzielony na te dwie kolumny „zmienna” i „wartość”. W kolumnie „Zmienna” pokazuje nazwę kolumny „podmiot”, aw kolumnie „wartość” pokazuje wartości kolumny „podmiot”. Indeks ma wielkość „3”, od „0 do 2”.

Wniosek

Metoda „melt ()” w pandaach to wszechstronny sposób modyfikacji pandasframe. Nauczyliśmy się, jak korzystać z funkcji pand (melt () do konwersji Big Dataframe na długą, z ramką danych za pomocą prostego przypadku użycia. Powinieneś stale restrukturyzować część części w naszym materiale, zachowując przynajmniej jeden segment na miejscu jako wskaźniki. Funkcja „melt ()” w pandaas jest fantastycznym narzędziem do modyfikowania danych. Jeśli zarządzasz wieloma różnorodnymi informacjami ekonomicznymi i związanymi z pieniędzmi i potrzebujesz ich w bardziej przyjaznym dla baz danych, jest to szczególnie pomocne.