Pandas Astype

Pandas Astype
Obiekt panda jest zwykle rzucany na określony dtype.Funkcja istype () przy użyciu metody AStype (). To narzędzie może również zmienić dowolną kwalifikującą się kolumnę na typ kategoryczny. Używamy go, gdy chcemy przekonwertować określony danych z tytułu kolumny na inny danych. Wejście do słownika Pythona można również użyć do jednoczesnej zmiany wielu typów kolumn. Nazwa kolumny i nowe danych, których chcemy użyć w kolumnach, są reprezentowane odpowiednio w słowniku przez etykiety klucza i wartości. Technikę pand Astype ma kilka zastosowań.

To narzędzie pozwala nam zmodyfikować danych:

  1. Seria pandy
  2. Każda kolumna w pance data
  3. Kilka kolumn w ramce danych

Jak korzystać z funkcji ASTYPE () w pandy

Aby użyć funkcji Astype (), musimy najpierw zrozumieć jej składnię. Zarówno obiekty szeregowe, jak i struki danych mogą być używane z metodą Astype. Składnia dla Astype w serii i atuty w kolumnach DataFrame jest następujące:

Składnia funkcji istype () w serii

Po prostu wpisz nazwę serii, a następnie „Składnia DOT” Astype (), aby wywołać metodę dla serii.

Składnia:

Składnia funkcji asype () w kolumnach DataFrame

Musimy najpierw wpisać nazwę ramki danych przed wywołaniem metody Astype () „Składnia DOT”.

Składnia:

Ramka danych.istype (dType, copy = true, errors = "easte", ** kwargs)

Dtype: Obiekt panda jest rzucany na ten sam typ za pomocą typu Python lub Numpy.Dtype. Jedna lub więcej kolumn DataFrame można rzucić na typy specyficzne dla kolumny. Możliwe jest również użycie col: dtype,? Jako alternatywa, gdzie Col reprezentuje nazwę kolumny, a DTYPE jest numpy.

Kopiuj: Zapewnia kopię, jeśli kopia = true. Gdy kopia = false, musimy zachować ostrożność, ponieważ zmiany wartości mogą rozprzestrzeniać się na inne obiekty pandy.

błąd: Jeśli spróbujesz zastosować nieprawidłowy lub nieprawidłowy danych na obiekcie, technika albo podniesie wyjątek, albo nie, w zależności od wartości parametru błędu. Dwie odpowiedzi na to są następujące:

wznosić(Jeśli wystąpi problem, podniesie wyjątek)

ignorować (Jeśli wystąpi problem, będzie to stłumić wyjątki. Zwróci oryginalny obiekt, jeśli wystąpi błąd)

W funkcji istype () rakiet = true domyślnie.

KWARGS: Konstruktor otrzymuje argument słów kluczowych (KWARGS) jako dane wejściowe.

Teraz widzieliśmy składnię. Na następujących przykładach nauczymy użycia funkcji ASTYPE ().

Przykład 1: Zmiana danych z serii pandy

Po pierwsze, zaimportujemy moduły pandas, a następnie użyjemy funkcji DataFrame () do utworzenia zestawu danych, przekazując mu słownik nazw kolumn i niektóre listy zawierające informacje, które chcemy przechowywać:

Ponadto utworzymy serię, która utrzymuje wyłącznie zmienną wydatków DataFrame:

Aby zilustrować naszą DataFrame, użyjemy funkcji print ().

Istnieją cztery zmienne: nazwa, kraj, sprzedaż i wydatki. W rezultacie oprawa danych obejmuje informacje o sprzedaży próbek lub manekina i wydatków dla niektórych osób z różnych krajów.

Sprawdźmy typ danych z naszej serii o nazwie E_VARIAble za pomocą Dtype.

Wskazuje to, że nasza seria E_VARIAble ma „obiekt” danych. Zmienimy teraz zestaw danych serii na INT64 za pomocą pandas qutype.

Zestaw danych wyjściowych jest DTYPE: INT64, ponieważ możesz zobaczyć, czy zwracasz szczególną uwagę na dno wyjścia. Pamiętaj, że zmienna E nie została przez to zmodyfikowana bezpośrednio. Ponieważ dane wyjściowe ASTYPE () zostało wydrukowane na konsoli, seria E_VARIAble nadal ma danych „Obiekt”. Musielibyśmy ponownie przypisać dane wyjściowe do rzeczywistej nazwy zmiennej za pomocą następującego kodu, gdybyśmy chcieli bezpośrednio zmienić dane na stałe:

Teraz typ danych z naszej serii jest zmieniony na stałe.

Przykład 2: Zmiana danych z danych kolumny DataFrame

Będziemy teraz działać w kolumnie DataFrame. Porównując to z przykładem 1, w którym pracowaliśmy z serią pandy, będzie nieco inne. W takim przypadku będziemy pracować z ramką danych. Dlatego składnia będzie się nieco różnić. Najpierw sprawdzimy bieżący danych naszego danych S_DATA. Aby sprawdzić danych danych, użyjemy DTYPE.

Aby zbadać dane danych wyjściowych, użyjemy dodatkowo .atrybut Dtypes.

Zobaczysz, że typ danych sprzedaży został zmodyfikowany do INT64 w wyjściu. Aby to osiągnąć, zastosowaliśmy funkcję atutyczną, przekazując argument słownika. Nazwa kolumny pojawia się po lewej stronie słownika, a nowy typ danych pojawia się po prawej stronie. Zmieńmy danych z innej kolumny naszej strumienia danych.

Data danych kolumny narodowej została całkowicie przekształcona w „String”, jak widać.

PRZYKŁAD 3: Zmiana danych dotyczących wielu kolumn w ramce danych

Zmieńmy teraz typ danych liczby kolumn naszych DataFrame. Można to zrobić w sposób, który jest dość podobny do sposobu, w jaki zmieniliśmy kolumnę w przykładzie 2. W tym przykładzie zastosujemy inny słownik.

Jeszcze raz zbadajmy oryginalne danych z użyciem .Atrybut Dtype przed wykonaniem operacji:

Jeszcze raz pamiętaj, że obiekt jest typem danych każdej kolumny w DataFrame.

Teraz zmodyfikujemy danych z kilku kolumn. Aby to osiągnąć, utworzymy słownik o nazwie i danych zmiennej jako parach „klucza” i „wartości”. Po atrybucie Astype dodatkowo zadzwonimy .atrybut Dtypes, abyśmy mogli obserwować nowe danych.

Zobaczysz, że w przypadku wyjścia zmieniły się trzy kolumny. Data danych kolumny krajowej jest zmieniona na ciąg, danych danych sprzedaży jest zmieniany na INT64, a danych wydatków jest zmieniane na INT32.

W nawiasie dodaliśmy słownik i przywołaliśmy metodę atuty. Niektóre pary klucza/wartości z formatem „kolumna”: „danych danych” były w słowniku. Nowe typy danych i nazwy kolumn muszą być podane tylko w słowniku.

Przykład 4: Castowanie danych z tytułu wszystkich kolumn w ramce danych

Metoda Pandas Astype () Domyślnie próbuje rzucić każdą kolumnę DataFrame na typy Python (int, tekst, float, data i dateTime) lub Numpy.DTYPE, które są dostarczane. Operacja nie powiada się, a błąd „Valueerror: nieprawidłowy literał” jest podniesiony, jeśli żadnych kolumn nie można rzucić z powodu nieprawidłowych danych lub NAN. W tym przykładzie utwórzmy nową ramkę danych ze słowników.

Wszystkie nazwy i dtypy kolumny DataFrame są zwracane przez DataFrame.Funkcja Dtypes. Pamiętaj, że każda kolumna ma typ obiektu w ramce danych pokazanej powyżej. Teraz rzucimy typ danych na ciąg.

Jak wcześniej widać, DTYPE jest aktualizowany dla wszystkich kolumn DF DataFrame.

Wniosek

W tym samouczku staraliśmy się nauczyć cię, jak korzystać z Python Pandy DataFrame.Metoda asype (). Zmieniliśmy zestaw danych kolumny DataFrame na inny typ danych, a następnie zbadaliśmy DataFrame. W tym artykule zaimplementowaliśmy kilka przykładów, więc możesz zmienić danych danych serii i danych z danych kolumny danych za pomocą metody Pandas Astype w Python.