Podzielone kolumny pandy przez ograniczenie

Podzielone kolumny pandy przez ograniczenie
„Pandy” to pakiet Python. Jest elastyczny i ma ekspresyjny projekt ustruktury danych. Również panda DataFrame świetnie nadają się do manipulowania danymi. Przez większość czasu pracujemy nad danymi, które mają kolumnę zawierającą wyznaczoną wartość ciągu, na przykład „x, y, z” i chcemy, aby znajdowały się w osobnych kolumnach. Jest to możliwe, używając funkcji pandy, o której będziemy omawiać w tym artykule. Będziemy uczyć się, jak podzielić kolumnę tekstu na osobne kolumny indywidualnie. W przypadku tej funkcji pand w podzielonej kolumnie według ogranicznika należy użyć. Jego składnia jest trochę jak funkcja Python „str ()”. Ale pandy podzielone według kolumny dzieli dane całej ramki danych. Do wdrożenia kodu będziemy używać narzędzia „Spyder”. Ponieważ jest to oprogramowanie przyjazne dla języka Pythona.

Składnia

Str.podział()

Powyższa składnia służy do podziału tekstu na kolumny w ramce danych. Działa poprzez podzielenie kolumny przez ograniczenie na różne kolumny. Wdrażamy składnię serii pandy „str.split () ”funkcja w kolumnie„ Adres ”i przekaż ją z„ przecinkiem ”dla oddzielenia kolumny, którą chcemy podzielić.

Parametry

Istnieją pewne parametry, których użyjemy później w przykładach podzielonej kolumny Panda przez delimiter:

Zwiększać: Rozszerza wartość ciągu na osobną kolumnę.

Warunki: Jeśli „prawda”, zwraca ramkę danych; Jeżeli „Fałsz” zwraca serię/indeks (ciągi).

„N” ogranicza liczbę podziału na wyjściu.

Poniżej znajdują się sposoby, w jakie można wykonać podzielone przez pandy przez ograniczenie:

  • podzielona kolumna pandas przez delimiter (dodaj nową kolumnę do „df”).
  • podzielona kolumna pandas przez delimiter (wewnątrz listy).
  • podzielona kolumna pandy przez delimiter określającą liczbę podziałów.

Tworzenie ramki danych dla przykładów implementacji kolumny podzielonej pandy przez delimiter

Po otwarciu narzędzia „Spyder” zaimportuj bibliotekę Pandy jako „PD”. Teraz zacznij tworzyć „DF”. „DF” to skrót „DataFrame”. „DF” ma pełny adres niektórych obszarów różnych krajów, takich jak: „5632 Main Street, Park, Kanada”; „2525 Downtown, Salt Mine, Włochy”; „7896 Sky View, mieszkanie, Meksyk”; oraz „3988” Sunshine Road, Villa, Japonia ”. Tutaj widzimy, że dane są oddzielone przez kolumnę. W następnych przykładach nauczymy się, jak podzielić te obszary „przecinka” na kolumny osobno za pomocą podziału pandy przez funkcję ogranicznika.

Dane wyjściowe pokazuje tworzenie danych danych podanych w kodzie.

Przykład 01: podzielona kolumna pandas przez ograniczenie na wiele kolumn

W tym przykładzie podzielimy kolumny danych tekstowych na wiele kolumn przez ograniczenie funkcji podzielonej pandy. DataFrame składa się z adresów ulic jako: „5623 Main Street, centrum handlowe, Turcja”; „4585 Downtown, School Area, Francja”; „0032 Sky View, College, Indonezja”; oraz „1125 Sunshine Next, University, Chiny”. Wszystkie te adresy są z różnych obszarów. Możemy powiedzieć, że możemy wziąć to jako operator rozpoznawania separatora. Będziemy stosować funkcję podzieloną pandy na „adres”. Następnie przecinek w tym przypadku będzie się dzielił. Musimy również upewnić się, że przekazujemy parametry jako „rozwinąć” dla wartości „prawdziwej”.

Wyjście wyświetla osobne kolumny adresu w kolumnie „0”. W kolumnie „1” mamy obszary szczególnie i w kolumnie „2” mamy nazwy krajów. Tworzona jest dobrze zaprezentowana i zorganizowana ramka danych.

Przykład 02: podzielona kolumna pandas przez ograniczenie wewnątrz listy

Utworzymy ramkę danych dla przykładowej implementacji kolumny podzielonej pandy przez delimiter tym razem „wewnątrz listy”. Rzeka danych jest „7854 Main Street, Shop Tire”; „8009 Downtown, Sweet Shop, Tokyo”; „1003 Sky View, lody warsztatowe, Sri Lanka”; oraz „7009 Sunshine Next, High School, Africa”. Teraz nie będziemy przekazywać w tym przykładzie parametru, aby wykonać podział wewnątrz kolumny.

Tutaj, na wyjściu, podział odbywa się wewnątrz kolumn. Ale to nie okazało się wyświetlać tworzenia oddzielnych kolumn, ponieważ podział znajduje się w liście. Jeśli chcemy podzielić na osobną kolumnę, ostatni przykład pokaże.

Przykład 03: podzielona kolumna pand według delimiter (dodaj nową kolumnę do „df”)

W tym przykładzie będziemy dodawać inną kolumnę do ramki danych obok osobnych kolumn, które można łatwo wykonać za pomocą podzielonej kolumny pandy i funkcji ogranicznika. Rama danych jest taka sama jak ostatni przykład. Teraz wybraliśmy „stan” jako kolumnę dodatkową. Mamy całą ramkę danych i kolejną kolumnę w osobnej kolumnie. W ten sposób, jeśli chcemy zmienić lub przeprowadzić jakąkolwiek analizę tej konkretnej ilości danych, możemy mieć je osobno bez wpływu na oryginalne dane.

Wyświetlacz ma oddzielone kolumny i dodaje kolumnę „stanu” w osobnej kolumnie siebie. To jest cztery na cztery kolumny, co oznacza 2 wiersze i 2 kolumny.

Przykład 04: podzielona kolumna pand według ogranicznika określająca liczbę podziałów

W przykładzie 01 powyżej dokonaliśmy podziału kolumn tekstowych, podając adres w sprawie wystąpienia ogranicznika „przecinka”, co spowodowało separację trzech kolumn. Podobnie możemy określić żądaną liczbę podziałów. W tym przypadku nauczymy się, jak to zrobić. Rama danych składa się z adresów jako: „4585 12th Street, sklep spożywczy, Nowy Jork ”,„ 7000 Portlands, lotnisko, Włochy ”; „4555 13th Ulica, dworzec kolejowy, Hiszpania ”; oraz „7777 Commercial Next, Candy Shop, Australia”. „N = 1” oznacza, że ​​chcemy kiedyś podzielić ramkę danych. Podział nastąpi przy pierwszym zdarzeniu, że pozostałe lewe kolumny będą widoczne razem.

Wyjście wyświetla rozdzielenie ramki danych za pomocą kolumny podzielonej pandas przez funkcję ogranicznika i oznaczając n jako „1”. Tak więc podział odbywa się tylko raz. Miasta i stany znajdują się w drugiej kolumnie, a pierwsze występowanie adresów znajduje się w pierwszej kolumnie.

Wniosek

Kolumna podzielona funkcja pandas przez ograniczenie jest przydatne i wydajne. Tak wiele razy zgodnie z potrzebą, chcemy mieć dane w określonej kolumnie lub konwencji według potrzeby. Wszystko to można zrobić za pomocą kolumny podzielonej pandy przez delimiter. Przeprowadziliśmy takie funkcje, jak dzielenie wielu kolumn, dzielenie w kolumnie, podział i dodawanie nowej kolumny, a na koniec podzielenie, określając liczbę podziałów.