Pandas DataFrame unikalny

Pandas DataFrame unikalny

Najpopularniejsza biblioteka Pythona, która jest wykorzystywana w naukach danych, nazywa się pandy. Oferuje Programiści Python o wysokiej wydajności, przyjaznej dla użytkownika i narzędzia do analizy danych. Gdy zrozumiesz podstawowe funkcje i sposób ich wykorzystania, pandy jest silnym narzędziem do zmiany danych. W „Pandy” standardowymi metodami przechowywania danych w formie tabelary. Możemy wykorzystać niektóre metody „pandy” do uzyskania unikalnych wartości w kolumnie „Pandy” DataFrame. Kiedy musimy uzyskać unikalne wartości w kolumnach DataFrame i nie chcemy powielania wartości w kolumnie „Pandy”, możemy użyć metod, które zapewnia to „pandy”. Spójrzmy na takie metody w tym przewodniku, wraz z kilkoma przykładami i wyjściem, aby uzyskać unikalne wartości w kolumnie „Pandy” DataFrame.

Metody uzyskania unikalnych wartości w kolumnach „Pandy” DataFrame

Możemy wykorzystać dwie metody uzyskania unikalnych wartości w kolumnach „Pandy”. Upuszczamy zduplikowane wartości i otrzymujemy tylko unikalne wartości w kolumnach DataFrame. Metody, które przewidują „pandy” do wykonania tego zadania, to:

  • Wykorzystując metodę unikalną ().
  • Wykorzystując metodę Drop_Dupliactes ().

Teraz wykorzystamy obie metody w kodach „pandy” do uzyskania unikalnych wartości w kolumnach „Pandy”.

Przykład nr 01

Aplikacja „Spyder” jest tutaj wykorzystywana do generowania tych kodów „pandy” w celu wykorzystania tych metod, które pomagają nam uzyskać unikalne wartości w kolumnach „Pandy”. Musimy zaimportować moduły „pandy”, które są niezbędne dla kodu „pandy”, przed utworzeniem ramki danych. Korzystając z terminu „import” i umieszczając „Pandy jako PD”, importujemy te moduły.

Teraz, przy pomocy „PD”, możemy szybko uzyskać funkcje lub metody „pandy”. Następnie umieszczamy „tematy_data”, w którym dodajemy „imię” i w „nazwie”, dodajemy dane nazwy, które są „Roman, William, Peter, Smith, John, Milli, Thomas i James”. Następnie dodajemy dane tematyczne w „subj”, które są „matematykami, ekonomią, nauką, matematyką, statystyką, statystyką, statystyką i komputerem”. Następnie konwertujemy ten „tematy_data” w ramkę danych „tematy_df” za pomocą „PD.Metoda dataFrame () ”. Umieszczamy „tematy_df” w metodzie „print ()”, aby wyświetlał się na terminalu.

Teraz chcemy uzyskać unikalne wartości w kolumnie „Pandy” DataFrame „Subj”. W tym celu używamy tutaj metody „unikalnej ()” i dodajemy nazwę kolumny, a także nazwę DataFrame, jak pokazano poniżej. Dodajemy tę metodę w „print ()”, więc wynik będzie również wyświetlany na terminalu.

Teraz naciskamy „Shift+Enter”, aby uzyskać wynik tego kodu i renderuje on na terminalu i jest również pokazany, który zawiera ramkę danych ze wszystkimi wartościami. Jest to oryginalna ramka danych, którą dodaliśmy w kodzie i poniżej wyświetla unikalne wartości kolumny „subj”. Upuszcza duplikaty i wyświetla unikalne wartości kolumny „subj” w ramce danych.

Przykład nr 02

Tworzymy „lista próbki”, która zawiera pewne informacje. Wstawiamy „Layla, 21, 28, 31, 14 i 39”, które pojawią się jako pierwsza kolumna, gdy przekonwertujemy tę listę na ramkę danych. Następnie dodajemy „Lusy, 31, 25, 34, 26 i 21” jako drugi rząd DataFrame. Następnie mamy „Peter, 38, 20, 20, 35 i 24” oraz „Layla 38, 23, 39 24, 23”, które będą trzecim i czwartym rzędem ramki danych. Wkładamy również trzy kolejne dane, które to „Stella, 21, 24, 24, 28, 31”, „Layla, 33, 32, 26, 30, 25”, a także „Peter, 21, 21, 31, 21, 29”.

Teraz przekształcamy „próbkę_list” w „df_sample”, który jest tutaj nazwą frame danych, umieszczając „PD.Funkcja dataFrame () ”. Ponadto ustawiamy nazwę kolumn tej ramki danych, a te nazwy to „Nazwa, ASS_1, ASS_2, ASS_3, ASS_4 i ASSH_5”. Następnie używamy „print ()”, który pomaga wyświetlać ramkę danych „DF_Sample”. Teraz używamy innej metody w tym przykładzie, aby uzyskać unikalne wartości w kolumnie DataFrame. Ta metoda jest metodą „Drop_duplicates ()” „Pandy”.

W metodzie „Drop_duplicates ()” ustawiamy nazwę kolumny, w której chcemy uzyskać unikalne wartości w kolumnie DataFrame. Otrzymujemy unikalne wartości kolumny „Nazwa”, upuszczając zduplikowane wartości w tej kolumnie za pomocą metody „Drop_Duplicates ()”, a także renderuj te unikalne wartości za pomocą funkcji „print ()” tutaj.

Nazwy zduplikowane są upuszczone, a unikalne wartości są renderowane po zastosowaniu metody „Drop_duplicates ()”. Możesz zauważyć, że nazwa „Layla” pojawia się w trzech komórkach kolumny „Nazwa”. Ale gdy do tej kolumny zastosowano metodę „Drop_duplicates ()”, wszystkie zduplikowane wartości są upuszczane, a na ekranie pojawiła się jedna nazwa „Layla”. Po upuszczeniu duplikat. W ten sposób możemy upuścić zduplikowane wartości i uzyskać unikalną wartość w kolumnie DataFrame za pomocą metody „Drop_Duplicates ()”.

Przykład nr 03

Ta sama strumienia danych jest ponownie wykorzystywana, a teraz stosujemy metodę „unikalną ()” tutaj. Za pomocą metody „unikalnej ()” umieszczamy nazwę kolumny, a także nazwę DataFrame, na której chcemy zastosować tę metodę „unikalną ()”, aby uzyskać unikalne wartości. Pozwoli to tylko unikalne wartości tej kolumny i nie wyświetli tych wartości w formie DataFrame.

TutajFrame danych zawiera siedem wartości w kolumnie „Nazwa”, ale kiedy stosujemy metodę „unikalną ()” do tej kolumny, pojawiły się tylko cztery wartości i są to unikalne wartości tej kolumny. Nie renderuje zduplikowanych wartości.

Przykład nr 04

Rrama danych, którą tworzymy w tym przykładzie, to „f_g_df”. W tym danych danych wstawiamy „my_fruits” i „my_vegs”. Kolumna „My_fruits” zawiera „Apple, Orange, Apple, Gruszkę, Lychee, Apple, Apple, Gruszkę i Apple”. Następnie mamy „My_Vegs”, które zawierają nazwy warzyw, które są „chili, przyniesieniem, marchewką, ziemniakiem, ziemniakiem, marchewką, cebulą, czosnkiem i imbirem”. Ta konstrukcja danych zawiera tylko dwie kolumny.

Teraz otrzymujemy unikalne wartości w obu kolumnach za pomocą metody „unikalnej ()”. Wymieniamy nazwę DataFrame. Następnie umieść nazwę pierwszej kolumny. Następnie wykorzystujemy metodę append (). W tym dodatku ponownie umieszczamy nazwę DataFrame i drugiej nazwy kolumny i umieszczamy metodę „unikalną ()”. Otrzymuje to unikalne wartości obu kolumn, a następnie dołączy unikalne wartości obu kolumn i pojawią się na ekranie.

Rzekie danych jest renderowane najpierw zawierające wszystkie wartości. Następnie stosowana jest metoda „unikalna ()”, a unikalne wartości obu kolumn są renderowane poniżej. W tym kodzie otrzymujemy unikalne wartości w wielu kolumnach DataFrame za pomocą metody „unikalne ()”.

Wniosek

Pełne wyjaśnienie uzyskania unikalnych wartości w kolumnie DataFrame znajduje się w tym przewodniku. Omówiliśmy metody „unikalne ()” i „drop_duplicates ()”, które pomagają nam uzyskać unikalne wartości kolumny DataFrame. Zbadaliśmy, jak używać tych metod w kodzie „pandy”, używając tych metod tutaj w naszych kodach. Zilustrowaliśmy różne przykłady w tym przewodniku i pokazaliśmy, jak uzyskać unikalne wartości jednej kolumny za pomocą metody „unikalne ()”, a także metodę „Drop_duplicates ()”. Zbadaliśmy również, jak uzyskać unikalne wartości w wielu kolumnach, wykorzystując metodę „unikalną ()” w tym przewodniku.