Pandy do ciągów

Pandy do ciągów
„Podejścia do danych i serii, które oferują nam pandy, mogą być używane dla każdej kolumny w ramie danych i są zaprojektowane do pracy z Strings. Korzystając z metody „ApplyMap (STR)”, możemy zmienić ramkę danych na struny, jak widać w poniższej próbce. Ta metoda łatwo przekonwertuje typ danych na typ ciągu. W Panand użyliśmy przede wszystkim „obiektu” jako typu danych dla ciągu. Możemy określić całkowitą liczbę znaków zawartych w wartościach kolumny, wykorzystując technikę „długość ()” w przetwarzaniu ciągu."

Składnia do konwersji ramki danych na ciąg

Składnia do uzyskania długości wartości ciągów obecnych w kolumnie

Przykład 1: Konwertuj ramkę danych na struny za pomocą ApplyMap (STR)

W Python istnieje wiele skonstruowanych metod pracy z strunami. Każda z tych metod zwraca nową wartość bez zmiany oryginalnego ciągu. Dla wartości ciągów używany jest typ danych „obiekt”. W Python Pandy typ danych tekstowych jest określany jako „ciąg” lub „obiekt”. Ciąg może zawierać wyrażenie słów lub może być liczbą. W tym przypadku użyjemy „ApplantMap (STR)”, aby przekształcić całą ramkę danych w typ ciągu. „Zastosuj (STR)” służy do konwersji liczb całkowitych na struny, a ApplyAmap (STR) jest wykorzystywany do konwersji pełnej ramki danych na struny.

Porozmawiajmy teraz o wykonaniu naszego kodu. Aby wykonać nasz kod, użyliśmy narzędzia „Spyder”. Biblioteka PandaS musi zostać zaimportowana jako „PD”. Następnie zbudowalibyśmy naszą strumień danych. Rama danych nazywa się „Dane”. Mamy trzy kolumny w tym „kursie”, „Opłaty” i „Godzinie kredytowej”. Te kolumny mają teraz przypisane pewne wartości. Mamy listę kursów „Python”, „Oop”, „Virtual_ Studio” i „Java” w kolumnie „Kurs”. Wartości kolumny „Opłata” mamy „35000”, „30000”, „20000” i „15000”, a w ostatniej kolumnie „credit_hour”, mamy „3”, „4”, „3” i „ 3 ”. Dlatego „PD.DataFrame ”jest używany do tworzenia ramki danych. W tej ilustracji wyświetlamy również „typy danych” naszego programu za pomocą funkcji „print ()” z „DF. DataTypes ”. Zasadniczo „DF.DataTypes ”służy do utworzenia typu danych dla DataFrame.

Przechodzimy teraz do głównego celu naszego programu. Aby przekonwertować ramkę danych na ciąg, używamy „DF.ApplyMap (STR) ”. Za pomocą metody „ApplapMap ()” funkcję można zastosować dwukrotnie do dowolnego elementu DataFrame. W Panand „STR” jest najczęściej używany do pobierania wartości ramek danych lub serii. W tym programie występuje to, że ta funkcja konwertuje typy danych z „liczb całkowitych” na typy danych „ciągów”. Wzywając funkcję „print ()”, wyświetlamy teraz naszą strumień danych i jej typy danych po użyciu „ApplantMap (STR)”.

Dwie ramy danych z typami danych zostaną wyświetlone na obrazie wyjściowym naszego programu. W drugiej ramce danych możemy zobaczyć, że przekonwertował ramkę danych na ciąg, zmieniając typ danych. Typy danych liczb całkowitych są teraz wyświetlane jako typy danych „obiekt”. Do ciągu używamy „obiektu” jako typu danych. Ten typ danych „obiekt” pozwala na to, że jest to jedna wartość, liczba lub zdanie. W pierwszej ramce danych typy danych dla kolumn „Opłata” i „Credit_hour” były liczbami całkowite; Jednak po przekonwertowaniu na struny typy danych dla tych kolumn są wyświetlane jako „obiekty”. Wreszcie wyświetla „Dtype: obiekt”, wskazując, że został przekonwertowany na ciąg.

Przykład 2: Przekształcenie wartości kolumny na typ ciągu za pomocą funkcji „asyPePe ()”

W tym przykładzie typ danych pojedynczej kolumny zostanie przekonwertowany na typ „ciąg”. W poprzednim przykładzie cała ramka danych została przekonwertowana na struny, podczas gdy w tym przypadku tylko pojedyncza kolumna jest konwertowana na struny. Przekształciliśmy kolumnę na typ ciąg. Funkcja „istype ()” w pandy jest wykorzystywana przede wszystkim, gdy chcemy przekształcić jeden typ danych w inny typ danych; Istnieją jednak inne alternatywne metody w Pythonie do jednoczesnej zmiany jednego lub więcej typów danych.

Teraz zacznij kodowanie. Biblioteka Pandy musi najpierw zostać zaimportowana jako „PD.„Poniższy krok obejmuje tworzenie ramki danych o tej samej nazwie co„ dane ”z poprzedniego etapu. Ta oprawa danych ma cztery kolumny „kurs”, „ładunki”, „czas trwania” i „rabat”. Dla każdej z tych kolumn wymieniliśmy określone wartości. Wartości w pierwszej kolumnie są następujące „Java”, „Graphic_desiging”, „Android_studio” i „OOP”. W drugiej kolumnie „ładowania” mamy „20000”, „21000”, „20000” i „24000”. Mamy wartości „1_month”, „2_month” i „3_month” w trzeciej kolumnie, „Czas trwania”, a w końcowym wpisie mamy rabaty „20%” i ​​„30%” dla kursów. Następnie generowany jest za pomocą „PD.ramka danych". DataFrame będzie teraz wyświetlany na ekranie za pomocą funkcji „print ()”, a jej typy danych zostaną również wydrukowane za pomocą „DF.polecenie dTypes ”.

Użyjemy teraz funkcji „Astypes ()”, aby przekonwertować konkretną kolumnę na ciąg. Dzięki „istype ()” i nazwie kolumny parametrów „ładunki” i typu danych „String” w środku, w tym przypadku przekształcamy kolumnę „ładunki” na ciąg. Teraz zastosujemy funkcję „print ()”, aby pokazać wyniki na ekranie.

Jak widzimy, typ danych dla kolumny „ładuj” w pierwszym przypadku to „INT64”, co oznacza, że ​​wartości w kolumnie są liczbami całkowitymi, ale kiedy kolumna została przekonwertowana na ciąg, „ciąg” pokazano w przód „ładowania” jako typ danych. Typ danych dla ciągu w Pythonie jest „obiektem”, a ponieważ pozostałe trzy kolumny są ciągi, wskazuje, że teraz cała oprawa danych zostanie przekształcona w ciągu.

Przykład 3: Określenie długości ciągu dla określonej kolumny w ramce danych

W tym przykładzie określamy długość każdej wartości ciągu dla określonej kolumny w ramce danych. Za pomocą funkcji „długość ()” możemy określić długość wartości ciągów. Ta metoda służy do określenia całkowitej znaku w ciągu wejściowego.

Po zaimportowaniu biblioteki pandy, aby rozpocząć trzeci przykład naszego artykułu, musimy skonstruować ramkę danych z trzema kolumnami, podobnie jak w poprzednim przykładzie, używając „PD.ramka danych". „Student_name”, „Roll_number” i „Total_marks” są dostępne jako kolumny. Te kolumny są wymienione z niektórymi wartościami. „Albert”, „Jhon”, „Ava”, „Oliver” i „Amelia” są wymienione w pierwszej kolumnie, podczas gdy ich liczby rollowe są wymienione w drugiej kolumnie jako „1”, „2”, „3”, ” 4 ”i„ 5 ”. W ostatniej kolumnie podajemy ich ostatnie oceny „498”, „470”, „444”, „390” i „489”, odpowiednio. Teraz, gdy instrukcja „DataFrame” została wydrukowana, użyjemy funkcji „print ()”, aby wyświetlić pod nią ramkę danych.

Następnie wyświetlamy linię instrukcji z napisem „Obliczanie długości łańcucha w kolumnie” i obliczamy to za pomocą funkcji „długość ()”. Z naszej ramki danych możemy zaobserwować, że kolumna „Student_name” zawiera wartości ciągów, abyśmy mogli określić długość jej wartości. Używamy tej kolumny. Dlatego używamy „DF [nazwa studenta]” z „Apply (len)”. To doda całkowitą liczbę każdej wartości w tej kolumnie, która zostanie następnie wyświetlona jako nowa kolumna w ramce danych o nazwie „Student_name_length”. Przejdźmy obecnie do jego wyników.

Wyświetlane są tutaj dwie ramy danych, jak widać. Druga ramka danych ma dodatkową kolumnę „Student_name_length” i jak widzimy, obliczy całą liczbę słów i wyświetli ją tam. Na przykład nazwa „Albert” ma w sumie 6 znaków. Wskazuje to, że ta funkcja działa z powodzeniem w naszym programie.

Wniosek

Pandy oferują różne metody przekształcania ramki danych w ciąg. Cała ramka danych może zostać przekonwertowana na ciąg za pomocą „ApplyMap (Str)”, który przekształci liczbę całkowitą typu danych na ciąg. Obliczanie znaków wartości ciągów w kolumnie za pomocą metody „długość ()” jest również bardzo pomocne. Jeśli chcemy obliczyć wiele pojedynczych wartości, ta technika Pandy Uprości nas. To będzie łatwiejsze do pracy, jeśli zastosujemy małe, proste strategie. Oczekujemy, że jeśli skutecznie zastosujemy te strategie, nasza praca będzie zbyt prosta.