Kolumny pand

Kolumny pand
Prostokątna siatka o nazwie Pandas DataFrame jest używana do przechowywania danych. Dane zapisane w ramce danych są proste do wizualizacji i manipulowania. Rama danych może składać się z wielu wierszy i kolumn w nim. Każdy wiersz reprezentuje pomiar pojedynczej instancji, podczas gdy każda kolumna jest wektorem zawierającym dane określonego atrybutu lub zmiennej. Rzędy danych danych mogą zawierać dane heterogeniczne lub jednorodne w dowolnym wierszu, ale każda kolumna DataFrame zawiera jednorodne dane w dowolnej kolumnie. Osieframy danych w pandy są oznaczone, w przeciwieństwie do osad dwuwymiarowych tablicy. W tym artykule omawiamy różne metody dodawania, modyfikowania i usuwania kolumn lub wartości pandy w kolumnach ramki danych w pandy. Można to zrobić różnymi metodami. Zobaczmy niektóre z tych metod szczegółowo.

Jak dodać kolumny lub wartości do kolumny w pandy

Kolumny można dodać do ramki danych przy użyciu kilku metod. W poniższym przykładzie używamy funkcji Applape () i Insert (), aby dodać kolumny do naszego DataFrame.

Przykład 1: Dodaj kolumnę do DataFrame za pomocą funkcji Applape ()
Możesz dodać wiele kolumn do ramki danych za pomocą pandy.Ramka danych.metoda przypisania (). Najpierw tworzymy przykładową ramkę danych za pomocą PD.Funkcja dataFrame () z niektórymi wierszami i kolumnami. Biblioteka „Pandy” jest importowana najpierw, aby utworzyć pandas DataFrame.

Stworzyliśmy ramkę danych „DF”, przekazując słownik z dwoma klawiszami - „C1” i „C2” - z wartościami [„A”, „B”, „C”] i [„D”, „E”, „F”, „F ”Odpowiednio]. Przekazując słownik w PD.DataFrame, klawisze stają się etykietą kolumn, a wartości na liście stają się danymi każdej komórki w kolumnach ramki danych.

Jak widać, stworzyliśmy teraz ramkę danych z dwiema kolumnami. Korzystając z funkcji Assid (), dodajemy kolejne kolumny lub kolumny do naszej „DF” DataFrame.

Funkcja podaje nową ramkę danych „New_DF”, która zawiera zarówno dodatkową kolumnę (nowo dodaną „C3”), jak i wszystkie stare kolumny („C1” i „C2”) w rezultacie. Należy pamiętać, że jeśli jakieś aktualne kolumny zostaną ponownie przypisane, wszystkie zostaną zastąpione.

Przykład 2: Dodaj kolumnę do DataFrame za pomocą funkcji INSERT ()
„DataFrame.Metodę insert () ”można również użyć do dodawania kolumn do ramki danych. Najpierw utwórzmy ramkę danych z niektórymi wierszami i kolumnami.

Aby wyświetlić naszą „DF”, używana jest funkcja print (.

Nasza DataFrame ma dwa wiersze - A i B - z wartościami [„1”, „2”, „3”] i [„4”, „5”, „6”]. Teraz używamy metody INSERT (), aby dodać kolejną kolumnę w „DF” DataFrame.

Przed użyciem funkcji INSERT () utworzyliśmy listę o wartościach [„7”, „8”, „9”]. Indeksowanie kolumn przezFrame do danych rozpoczyna się od zera. Kiedy zastosowaliśmy funkcję INSERT () do „DF” DataFrame, określiliśmy indeks 1, aby umieścić nową kolumnę „C”. Przeszliśmy również listę „Wartości” w parametrach funkcji Insert (), aby przechowywać wartości kolumny „C”.

Możesz zauważyć, że nasza nowa kolumna jest dodawana na 2Nd Lokalizacja kolumny między „a” i „b”, ponieważ określiliśmy indeks „1” w parametrach funkcji insert ().

Jak wybrać kolumny w pandy

Kolumny można wybrać za pomocą ich pozycji indeksu, etykiet lub danych. Zobaczymy, jak wybrać określone i wiele kolumn w następujących przykładach.

Przykład 1: Wybierz określoną kolumnę za pomocą nazw kolumn/etykiet
Tworzymy przykładową ramkę danych, aby pokazać, w jaki sposób możesz wybrać określoną kolumnę DataFrame.

Utworzyliśmy ramkę danych z kolumnami „col1” i „col2”. Najprostszym sposobem na uzyskanie określonej kolumny DataFrame jest zapisanie nazwy kolumny jako ciągu z cytatami w nawiasach [].

W danej ramce danych mamy dwie kolumny numeryczne - „col1” i „col2” - mające odpowiednio wartości (3, 1, 5) i (7, 2, 6).

Korzystając z listy z wieloma nazwami kolumn DataFrame w nawiasach „[]”, możesz wybrać wiele kolumn.

Jak widać, przeszliśmy listę zawierającą zarówno nazwy kolumn „col1” i „col2” w nawiasach.

Przykład 2: Wybierz określoną kolumnę według ich danych danych
Tworzymy ramkę danych o kolumnach z różnymi danych.

Kolumna „Nazwa” przechowuje nazwy osób („Tim”, „Alex”, „Joe”, „Rick”). Podczas gdy kolumna „wiekowa” przechowuje wiek osób (12, 11, 11, 13). Sprawdźmy dane danych naszych kolumn DataFrame za pomocą atrybutu „DTYPES”.

Data danych kolumny „Nazwa” to „Obiekt”, a „Int64” to danych typu kolumny „wiek”. Teraz wybieramy kolumny według ich danych za pomocą funkcji „loc []”.

Wewnątrz DF.Funkcja loc [], określiliśmy DTYPES == 'INT64'. Wartości są zwracane tam, gdzie danych typu danych jest „int64” za pomocą „.Wartości ”atrybut z DF.loc [:, (df.DTYPES == 'INT64') Funkcja.

Przykład 3: Wybierz wiele kolumn według ich indeksów
Tworzymy nową przykładową ramkę danych, aby pokazać, jak wybrać wiele lub wszystkie kolumny DataFrame za pomocą metody „ILOC []”.

Ponieważ utworzyliśmy naszą DataFrame, teraz używamy metody ILOC [] do wyboru wielu kolumn z naszego DataFrame. Po wybraniu pojedynczej kolumny metoda ILOC [] zwraca obiekt szeregowy. Po wybraniu więcej niż 1 kolumny zwracany jest pandas DataFrame.

Określiliśmy zakres indeksu kolumn od 0 do 3. Należy zauważyć, że kolumna przy indeksie 3 nie jest częścią grupy. Wybierane są tylko kolumny z indeksu 0 do 2.

Jak widać, kolumny „w”, „x” i „y” są wybierane poprzez określenie zakresu 0: 3.

Jak zmienić nazwy kolumn i wartości kolumn

W poniższym przykładzie zmienimy nazwy kolumn za pomocą funkcji rename () i zmienimy wartości za pomocą funkcji zamiennika ().

Przykład 1: Zmień etykietę kolumny za pomocą funkcji rename ()
Najpierw tworzymy ramkę danych o jednej lub więcej kolumn.

Po utworzeniu ramki danych możemy zmienić nazwę jego kolumny za pomocą funkcji pandas rename (). Wewnątrz funkcji Rename () używamy słownika takiego jak original_label: new_label. I określamy bieżącą etykietę i nową etykietę (którą chcemy dodać).

Jak można zauważyć, zmieniliśmy nazwę kolumny „A” na „Nazwa” i nazwę kolumny „B” na „podmiot”.

Przykład 2: Zmień wartości kolumny za pomocą funkcji Replay ()
Tworzymy ramkę danych o liczbie kolumn przechowujących wartości. Następnie modyfikujemy wartości kolumn za pomocą funkcji zastępczej ().

Ponieważ utworzyliśmy naszą ramkę danych, zmieńmy teraz wartości jego kolumny za pomocą funkcji zastępczej (). Metoda zastępcza () zamienia wartość w kolumnie DataFrame na nową określoną wartość.

Funkcja zastępcza () zastąpiła wartość kolumny „x” z kolumny „5” do 9.

Jak usunąć kolumny pandas

Kolumny DataFrame można usunąć za pomocą metody Drop () i Del w pandy.

Przykład: Usuwanie kolumny z pandas DataFrame
Najpierw utwórzmy ramkę danych, z której usuniemy określone kolumny za pomocą metod Drop () i Del.

Mamy „DF” z 4 kolumnami („A”, „B”, „C”, „D”). Metoda DayFrame Data Frame usuwa wiersze lub kolumny na podstawie odpowiednich osi i określonych nazwy kolumny (etykieta). Usuńmy kolumnę „A” za pomocą funkcji Drop ().

Oś = 1 oznacza, że ​​usuwamy kolumnę, a nie wiersz.

Funkcja Drop () z powodzeniem usunęła kolumnę „A”. Teraz użyjmy metody „Del” w kolumnie „D”.

Kolumna „D” jest usuwana z ramki danych przy użyciu metody „Del”.

Wniosek

W tym samouczku omówiliśmy, jakie są kolumny w PandaS DataFrame. Wykorzystaliśmy różne funkcje, aby dodawać, modyfikować i usuwać kolumny z naszego DataFrame. Ten samouczek ma na celu nauczanie różnych operacji, które można wykonać w kolumnie DataFrame w pandy. Zaimplementowaliśmy wiele przykładów, aby nauczyć Cię, w jaki sposób możesz dodawać kolumny lub wartości w kolumnie, jak wybrać kolumny, jak zmienić nazwy kolumn i wartości kolumny oraz jak usunąć kolumnę z pandas dataframe.