Zmiana nazwy kolumn w ramce danych pandas

Zmiana nazwy kolumn w ramce danych pandas

Każdego dnia ludzie obsługują ogromne dane, które nazywaliśmy Big Data. W tych dużych zbiorach danych czasami zawiera nazwy kolumn lub czasami bez nazw kolumn. Nazwy kolumn są tam, ale zawierają nieistotną nazwę lub niektóre niechciane znaki, takie jak przestrzenie itp. Przed rozpoczęciem analizy musimy więc najpierw przetwarzać te ogromne dane. Przede wszystkim wymagamy zmiany nazwy nazw kolumn.

Ramka danych to dane tabelaryczne zorientowane na wiersz, które zawierają wiersze i kolumny. Możemy również powiedzieć, że DataFrame to zbiór różnych kolumn, a każda kolumna jest różnych typów, takich jak ciąg, numeryczne itp.

$ pand.Ramka danych

Pandy Ramka danych można utworzyć za pomocą następującego konstruktora

$ pand.DataFrame (data = brak, indeks = brak, kolumny = brak, dType = brak, copy = false)

Metoda 1: Używając funkcji REAMAME ():

Składnia:

df.Zmień nazwa (kolumny = d, inplace = false)

Stworzyliśmy Ramka danych (df), których użyjemy do wyświetlania różnych metod renimie ().

W powyższym Ramka danych, Widzimy, że mamy cztery kolumny [„Nazwa”, „wiek”, „ulubiony_color”, „klasa”].

Pandy mają jedną wbudowaną funkcję o nazwie Rename (), która może zmienić natychmiastową nazwę kolumny. Aby tego użyć, musimy przekazać klawisz (oryginalna nazwa kolumny) i wartość (nowa nazwa kolumny) do funkcji Zmień nazwę pod atrybutem kolumny. Możemy również użyć innej opcji na miejscu do true, która zmienia się bezpośrednio w istniejących Ramka danych Domyślnie w miejscu jest fałszywe.

Z powyższego wyniku widać, że nazwy kolumn zmieniły się.

Metoda 2: Za pomocą metody listy

Pandy Ramka danych podał także kolumnę nazw atrybutów, która pomaga nam uzyskać dostęp do wszystkich nazw kolumn Ramka danych. Korzystając z tego atrybutu kolumn, możemy również zmienić nazwę nazwy kolumny. Musimy przekazać nową listę kolumn i przypisać do atrybutu kolumn, jak pokazano poniżej:

Główną wadą używania metody listy do zmiany nazwy nazwy kolumny jest to, że musimy przekazać wszystkie nazwy kolumn, nawet jeśli chcemy zmienić tylko kilka nazw kolumn.

Metoda 3: Zmień nazwę nazwy kolumny za pomocą pliku Read_CSV

Możemy również zmienić nazwę kolumn podczas samego Read_CSV. W tym celu musimy utworzyć listę kolumn i przekazać tę listę jako parametr do atrybutu nazw podczas czytania CSV.

Używamy nagłówka atrybutu = 0, co oznacza, że ​​zastępujemy poprzednie kolumny .plik CSV z nowymi kolumnami, które przechodzimy przez atrybut nazw.

W powyższym .Metoda CSV, zmieniamy nazwy kolumn podczas korzystania z listy i przechodzimy wszystkie nowe kolumny wewnątrz tej listy. Ale czasami musimy zmienić nazwę tylko kilku kolumn. Następnie musimy użyć atrybutu USECOLS i wspomnieć o wartościach indeksu tych kolumn wewnątrz tego, jak pokazano poniżej:

W powyższym wymieniamy tylko pierwszą i ostatnią kolumnę pliku CSV, a za to przekazujemy wartości indeksu kolumn (0 i 3) na atrybut USECOLS.

Metoda 4: Korzystanie z kolumn.str.zastępować()

Ta metoda jest zasadniczo stosowana, gdy chcemy zmienić niektóre frazy na niektóre inne wyrażenia i nie chce zmieniać pełnej nazwy kolumny, takich jak przestrzeń na podkreślenie itp.

Z powyższego wyniku widzimy, że teraz przestrzenie zastępują podkreślenie.

Powyższa metoda ma również obiekt indeksu (DF.indeks.str.zastępować()).

Metoda 5: Zmiana nazwy kolumn za pomocą set_axis ()

Ta metoda służy do zmiany nazwy indeksu wraz z kolumną, jak pokazano poniżej:

Wniosek

W tym artykule pokazujemy różne metody zmiany nazwy kolumn. Najlepszą metodą, którą uważam, jest metoda renewame (), w której musimy przekazać tylko te kolumny, które chcemy zmienić nazwę w formacie słownika (klucz, wartość). Atrybut kolumn jest najłatwiejszą metodą, ale główną wadą jest to, że musimy przekazać wszystkie kolumny, nawet jeśli chcemy zmienić nazwę tylko kilku kolumn. Możemy również zmienić nazwę kolumn podczas czytania samego pliku CSV, co jest również dobrą opcją. Kolumny.str.Wymień () to najlepsza opcja tylko wtedy, gdy chcemy zastąpić niektóre znaki innymi znakami.