Pandy zmieniają typ kolumny na ciąg

Pandy zmieniają typ kolumny na ciąg
Typy kolumn z ramką danych mogą wymagać zmiany po utworzeniu z różnych powodów, takich jak konwersja kolumny na format numeryczny, który może być używany do modelowania i klasyfikacji. Ten samouczek pokazuje, jak przekonwertować wartości kolumny na strunowy typ danych za pomocą pakietu pandas Pythona. Postaramy się nauczyć cię, jak zmienić pand pływające i liczbowe wartości w struny. Dodatkowo dowiesz się korzyści płynące z korzystania z danych String w pandy, a także tego, jak ewoluowały ciągi w pandy. Użyjemy różnych funkcji, aby zmienić dane danych kolumny DataFrame na ciąg.

String BataType w pandy

Pandy domyślnie używają danych o obiekcie do przechowywania ciągów. Strings i mieszane typy danych są obsługiwane przez typ danych obiektu, jednak nie jest to szczególnie wyraźne. W Pandy w wersji 1 pojawił się dedykowany danych.0. Chociaż ten zestaw danych nie zapewnia jeszcze żadnych wyraźnych zasobów lub ulepszeń wydajności, zespół programistów Pandas powiedział, że stanie się to w przyszłości. W rezultacie w tym samouczku zastosuje wyłącznie string danych. Używaj „STR” zamiast tego, jeśli to możliwe, jeśli używasz wersji Python mniejszej niż 1.0.

Jak zmienić kolumnę pandas na ciąg

Można użyć różnych funkcji do zmiany kolumny w pandy na string danych z tytułu danych. Stosowanie metody Astype () jest najczęstszym sposobem na zrobienie tego. Rzućmy okiem na funkcję Astype (), aby zobaczyć, jak ona działa.

Składnia: DF.istype („kolumn_name”: str, errors = „Raise”)

df.asype (): Metoda wywołania funkcji Pandas Astype.

„Nazwa kolumny”: Str: Kolumny do konwersji na inny format (String DataType). Nazwa kolumny to kolumna, której danych danych zostanie zmienione. Wartości kolumny muszą zostać przekształcone w wymagany danych, czyli ciąg. Każdy wbudowany danych Python lub danych jest dopuszczalny.

błędy = „podniesienie”: Aby zdefiniować, w jaki sposób należy traktować wyjątki podczas konwersji. Tylko możliwe wartości komórek są przekształcane; „Raise” wyświetli błąd, a „Ignoruj” zignoruje.

Widzieliśmy składnię metody ASTYPE (). Teraz, w poniższych przykładach, dowiesz się, jak korzystać z Astype (), innych funkcji i atrybutów, aby przekonwertować kolumny DataFrame na struny.

Przykład 1: Za pomocą metody ASTYPE ()

Obiekt panda można przekonwertować na określony danych za pomocą metody atetype (). Każda odpowiednia istniejąca kolumna może być przekonwertowana na typ kategoryczny za pomocą funkcji Astype (). Kiedy musimy przekonwertować danych z określonej kolumny na inny danych, metoda ASTYPE () jest bardzo przydatna. W tym przykładzie zmienimy danych typu kolumny na ciąg za pomocą funkcji Astype (), ponieważ musimy utworzyć ramkę danych. Aby stworzyć ramkę danych, najpierw zaimportujemy bibliotekę pandy, aby użyć jej funkcji i funkcji.


Stworzyliśmy naszą strumień, przekazując słownik do PD.DataFrame () funkcja jako argument. Klucze słownika stają się etykietami dla każdej kolumny po przekazaniu ich w PD.Funkcja dataFrame () i wartości klawiszy stają się wartościami kolumn DataFrame. Aby wizualizować ramkę danych, używamy funkcji print ().


W poprzedniej ramce danych mamy cztery kolumny DataFrame. Pierwsza kolumna „Student” zawiera nazwiska studentów - „Jack”, „Tony”, „Marty”, „Alex”, „Rob”. W drugiej kolumnie „Wiek” wiek każdego ucznia jest przechowywany „16, 15, 18, 17, 17”. Podczas gdy kolumna „opłata” przechowuje opłatę każdego kursu „7000.0, 6500.0, 7100.0, 7000.0, 6900.0 ”. Podmiot kolumny składa się z nazwisk - „angielskiego”, „statystyki”, „matematyki”, „angielskiego”, „nauki” . Możemy sprawdzić danych z każdego wiersza za pomocą atrybutu Dtypes w następujący sposób:


Data danych kolumn „Student” i „Temat” to „Obiekt”.Podczas gdy danych typu danych kolumn „wiek” i „opłata” to odpowiednio int64 i float64. Teraz zmieńmy typ danych „Opłata” kolumny z Float na String.


Gdy zastosowaliśmy metodę Astypes () i przekazała „String danych”, aby zmienić danych kolumny „Opłata”, zobaczmy, czy kolumna jest konwertowana na ciąg, czy nie.


Możesz zauważyć, że typ danych kolumny „Opłata” jest konwertowana na ciąg z float64.

Przykład 2: Za pomocą metody MAP () i Apply ()

Metoda map () służy do konwersji wartości szeregowych na odpowiednie wejścia. Aby zmienić każdą wartość danych w serii o innej wartości, używana jest funkcja map (). Wartość tę można uzyskać z serii, dykt lub funkcji, podczas gdy użytkownicy mogą przekazać funkcję i zastosować ją do każdej wartości z serii pandy za pomocą funkcji pand (). Jednak funkcje te można użyć do zmiany danych kolumn. Użyjmy tej samej ramki danych, którą utworzyliśmy w poprzednim przykładzie.


Teraz sprawdzamy dane danych kolumn za pomocą atrybutu Dtypes.


Teraz zmieńmy dane danych „wiek” kolumny za pomocą funkcji map (.


Zastosowaliśmy zarówno funkcję Map (), jak i Apply () odpowiednio do kolumny „opłata” i „wiek”. Użyjmy atrybutu DTYPES na naszej ramce danych „DF”, aby zobaczyć wyniki.


Tutaj widzimy, że danych typu „string” nie można użyć podczas używania metody map () i Apply (). W rezultacie obie kolumny „wiek” i „opłata” są teraz konwertowane na danych obiektowych. Jednak pandy domyślnie używają danych o obiekcie do przechowywania „ciągów”, ale chcemy wyniku w danych „string”. Z tego powodu nie doradzilibyśmy używania tych metod w nowych wersjach Pythona w celu zmiany danych dotyczących kolumn.

Przykład 3: Za pomocą metody Astype ()

Wreszcie, używamy metody ASTYPE () do zmiany danych z ramki danych na struny. Widzieliśmy, jak zmienić dane dotyczące określonych kolumn z ramki danych na „ciąg” w poprzednich przykładach. Teraz zmieniamy dane danych na wszystkie kolumny na „ciąg” w tym przykładzie. Ponownie wykorzystujemy dla tego przykładu „DF”.


Korzystając z atrybutu DTypes, najpierw sprawdźmy danych typów naszych kolumn „DF”.


Żadna z kolumn w poprzedniej formie danych nie ma kolumny z przesyłką danych. Teraz używamy metody ASTYPE () do zmiany danych wszystkich kolumn DataFrame w „String” danych „String”.


Jak widać, po prostu używając właściwości istype () z ramką danych podczas przekazywania „ciągu” wewnątrz funkcji, możesz łatwo zmienić wszystkie kolumny DataFrame na ciąg.


Danych danych z każdej kolumny są zmieniane na ciąg.

Możemy również użyć funkcji ApplapMap () lub .wartości.istype () w celu konwersji danych, ale zwrócą one danych „obiekt” zamiast „String”.

Wniosek

W tym samouczku omówiliśmy, czym jest ciąg danych w Pythonie i jak możesz zmienić kolumnę pandas na ciąg. Nauczyliśmy się składni funkcji Astype (), aby zrozumieć, jak ona działa. Po przejściu przez ten samouczek możesz samodzielnie zmienić kolumny w ciągu. Wdrożyliśmy różne przykłady, aby nauczyć Cię, w jaki sposób można zastosować metodę mapy () i zastosowania ().