Pandy konwertują wszystkie kolumny na ciąg

Pandy konwertują wszystkie kolumny na ciąg
Pandy, pakiet oprogramowania Python, oferuje przetwarzanie danych i ocenę. Z łatwością porusza brakujące dane i jest szybka, elastyczna i jasna. Solidna struktura danych nie tylko oferuje, ale także poprawia funkcjonalność narzędzi do modyfikacji i analizy danych.

Data danych jest fundamentalnym elementem konstrukcyjnym używanym przez języki komputerowe do zrozumienia, jak zachować i zmienić dane. W Pandas DataFrame możesz często zamienić pojedyncze lub wiele kolumn w struny. Dogodnie, korzystając z różnych natywnych funkcji pandy, jest to łatwe do osiągnięcia.

W tym artykule nauczy Cię, jak przekształcić wartości w kolumnie w typ danych String za pomocą biblioteki PandaS w Python. Następnie odkryjesz, jak zamienić pływaki i liczby całkowite w sznurki pand. Dowiesz się, jak przekonwertować kolumny w pance data danych na ciąg, oprócz czterech odrębnych sposobów tego zrobienia. MAME DATAFRAME.Astype (STR), DataFrame.wartości.Astype (STR), DataFrame.Zastosuj (STR), DataFrame.Mapa (STR) i DataFrame.ApplyMap (STR) to niektóre z metod zastosowanych w demonstracji do konwersji dowolnego typu na typ ciągu.

Konstruowanie ramek danych za pomocą pandy.Metoda dataFrame ()

Pierwszym i najważniejszym wymogiem programu jest import biblioteki pandas jako PD, aby skorzystać z funkcji pandas. Kolejnym krokiem jest utworzenie pandasframe. Zbudujemy ramkę danych z trzema odrębnymi kolumnami, jedna z nich działa jako ciąg, a pozostałe dwa załadują się jako liczby całkowite. Następnie stosujemy funkcję print () do wyświetlania pięciu rekordów.

Na poprzedniej ilustracji stworzyliśmy ramkę danych, która wykorzystuje pandy.Metoda dataFrame (). Ta oprawa danych ma trzy kolumny: „Nazwa”, „wiek” i „wynagrodzenie”. Każda kolumna przechowuje pięć rekordów lub wartości. Utworzyliśmy obiekt „Dane” i przypisaliśmy go wyjście wywołania PD.Metoda dataFrame (). Tak więc Pandas DataFrame jest dostępny za pomocą tego obiektu. Następnie wykorzystaliśmy funkcję print () do wyświetlania ramki danych.

Utworzona przez nas właśnie strumienia danych pojawia się na terminalu, który można zobaczyć w migawce dołączonej w następujący sposób:

Teraz dowiadujemy się, że danych danych wszystkich kolumn DataFrame. Do tego używamy pandy .info () funkcja. .Info () Metoda wyświetla nam szczegóły dotyczące DataFrame, dostarczając danych dla każdej kolumny, pozwalając nam zbadać, w jaki sposób pandy przetwarza dane ciągu.

Zastosowaliśmy Pandas DataFrame.info () metoda w poprzednim kodzie. Następnie wywoływana jest funkcja print () posiadanie danych.info () jako swoje parametry do wyświetlania informacji o danych kolumn DataFrame.

Jest to wyjście wyświetlane na terminalu:

W poprzednim przykładzie możemy zauważyć, że pandy zawsze domyślnie obsługują ciągi jako obiekty. Strings i mieszane typy danych są obsługiwane przez typ danych obiektu. Nie jest to jednak wyraźnie oczywiste.

Pandy mają określony string danych z wersji 1.0. Chociaż ten typ danych nie zapewnia jeszcze żadnych wyraźnych ulepszeń przechowywania lub wydajności, zespół deweloperów pandas powiedział, że stanie się to w przyszłości. W rezultacie lekcja będzie wykorzystać wyłącznie string danych.

Zacznijmy od przekształcenia kolumny na ciąg przy użyciu preferowanego podejścia pandy.

Przykład 1:

Pierwszą metodą, z której korzystamy. Technika kolumny (serii) jest cechą pandy.

Jeśli obsługujesz pandy 1.0 lub później, przejdź w „ciągach”. W przeciwnym razie użyj „STR” do wydań pandów wcześniej niż 1.0. Przyjmując to, możesz mieć pewność, że zestaw danych String jest używany zamiast danych o obiekcie.

Zacznijmy od jego praktycznej demonstracji w środowisku Pythona.

W poprzednim kodzie przy użyciu wcześniej utworzonej „Dane” DataFrame, wykorzystaliśmy teraz pandy „.Funkcja istype () ”. Napisaliśmy nazwę DataFrame z „.ASTYPE () ”funkcja i dostarcza danych„ ciąg ”jako swój parametr. Potem wywołaliśmy „.info () ”metoda w nawiasach funkcji print () do wyświetlenia zaktualizowanego danych kolumn DataFrame.

Wykonanie poprzedniego skryptu Pythona daje nam następujący wynik:

Kolumna „wiekowa” naszej pandasframe, która początkowo była przechowywana jako INT64, jest obecnie traktowana jako pasaty danych, co można zobaczyć.

Przykład 2:

Możesz zastosować .Map () technika zmiany kolumny panda na struny w sposób identyczny z .Funkcja serii asytype () pandas.

Przejrzyjmy, czym to się wydaje:

Ilustracja zaczyna się od wykorzystania kodu ramki danych, który wyjaśniliśmy w poprzednim przykładzie. Po wydrukowaniu DataFrame wyświetliśmy danych z pomocą „.info () ”funkcja. Teraz wybieramy kolumnę, której danych jest NEDED, aby przekonwertować na ciąg. Ponownie wybraliśmy kolumnę „wiekową” do wspomnianego celu. Następnie wywołaliśmy „.Funkcja map () ”z obiektem DataFrame i określonej nazwy kolumny. Zdefiniowaliśmy również danych w ramach „.Mapa (str) ”. Musimy sprawdzić zaktualizowany zestaw danych za pomocą „.Metoda info () ”.

Dane wyjściowe można zobaczyć na poniższym obrazie:

Z tego wynika, że ​​nie można użyć danych z danych ciągów podczas korzystania z .Metoda map (). W konsekwencji dane są przechowywane w danych danych obiektowych. Z tego powodu, jeśli prowadzisz wydanie wyższe niż 1.0, radzimy nie stosować tej metody.

Przykład 3:

Podobnie jak opisana wcześniej technika, możemy również zmienić danych kolumny panda na struny za pomocą .Zastosuj () metodę. Obowiązują te same ograniczenia, ponieważ jesteśmy w stanie przekształcić je tylko w danych z tytułu danych obiektowych. Nadal nie jesteśmy w stanie przekształcić ich w String DataTypes.

Rzućmy na to okiem:

Jak widać w poprzednim podanym skrypcie, zastosowana jest metoda Apply (). Pomiędzy aparatem ortodontycznym tej funkcji określamy danych. Ta metoda nie przyjmuje „ciągu”. Zamiast tego działa z „str”. Następnie wyświetliśmy dane danych z wykorzystaniem metody info (.

Wynikowy terminal pokazuje, że zaktualizowany danych zmienił się z INT64 na obiekt, który jest ciągiem.

Przykład 4:

Ponadto możemy wykorzystać wartość pandy.Astype () funkcja, aby bezpośrednio przekształcić wartości kolumny w struny.

Tutaj badamy jego prace z implementacją kodu Pythona:

Dzięki tej samej ramce danych i kolumnie wykorzystaliśmy pandę „Wartości.Metoda istype () ”i przekazała danych„ STR ”jako argument. Na koniec wyświetliśmy dane danych za pomocą metody info ().

Daje nam to następujące dane wyjściowe:

Przykład 5:

Nasz ostatni segment uczy, jak korzystać z .Funkcja ApplapMap () w celu przekształcenia wszystkich kolumn Pandas DataFrame w struny.

W tej metodzie użyliśmy .Metoda ApplapMap (). Ponieważ chcemy przekonwertować wszystkie kolumny, nie musimy wspominać żadnej konkretnej nazwy kolumny z obiektem DataFrame, tak jak wcześniej. Po prostu użyliśmy obiektu DataFrame z .Funkcja applappMap () i przekazała danych „str” jako parametr.

To jest następujące dane wyjściowe:

Wniosek

Ta lekcja oparta jest na różnych metodach Pandy do konwersji kolumn na string danych danych. Wykorzystaliśmy wszystkie możliwe sposoby zapewnienia wielu łatwych wyborów, gdy napotykamy takie problemy. Wykazaliśmy kilka praktycznych przykładowych kodów, które pomogą Ci poznać różne techniki pandy. Mamy nadzieję, że to pisanie pomoże ci zrozumieć moduły pand.