Duplikat panopów pandy duplikat

Duplikat panopów pandy duplikat
Pandy ma metodę o nazwie „indeks.Drop_duplicates () ”, który pozwala nam upuścić zduplikowane indeksy z listy etykiet indeksowych. Indeks.Funkcja Drop_Duplicates () ”w PandaS zwraca indeks z odrzuconymi zduplikowanymi wpisami. Funkcja daje użytkownikowi swobodę wyboru, która duplikat powinna być przechowywana. Mamy dwie opcje: usuń pierwsze i ostatnie zduplikowane wpisy z listy lub usuń wszystkie zduplikowane dane z listy.

Jeśli chcesz skorzystać z tej funkcji, należy przestrzegać następującej składni:

Składnia:

Pandy.Indeks.Drop_duplicates (keep = „First”)

Parametr:
„„Trzymać„Parametr służy do regulacji sposobu obsługi duplikatów wartości. „Keep” jest potrzebne. Domyślnie wartość jest „pierwsza”.

  1. Kiedy wartość jest „Pierwszy”, Program traktuje pierwszy element jako odrębny, a inne identyczne wartości jak duplikaty. To, z wyjątkiem pierwszej instancji, eliminuje duplikaty.
  2. Jeśli wartość jest ustawiona na „ostatni”, Traktuje ostatni wpis jako unikalny, a inne identyczne wartości jak duplikaty. Następnie eliminuje wszystkie duplikaty, z wyjątkiem ostatniego wystąpienia tej wartości.
  3. Jeśli parametr „Keep” ma „FAŁSZ”Wartość, wszystkie identyczne wartości są traktowane jako duplikaty. Upuszcza wszystkie zduplikowane wartości z listy.

Przykład 1: Bez parametrów
W tym przykładzie mamy indeks o nazwie „indeks1”, który posiada 10 liczb całkowitych. Usuńmy duplikaty bez przekazywania żadnego parametru do funkcji Drop_Duplicates ().

importować pandy
# Utwórz indeks pand, który zawiera 10 wartości
indeks1 = pandy.Indeks ([45,67,45,89,45,89,12,34,67,89])
Drukuj („Rzeczywisty indeks:”, indeks1)
Drukuj („Unikalny indeks:”, indeks1.drop_duplicates ())

Wyjście:

Wyjaśnienie:
Unikalne wskaźniki są zwracane przez usunięcie duplikatów.

Przykład 2: Z Keep jako False
Miejmy indeks, który zawiera 5 strun z duplikatami. Teraz ustaw parametr „Zachowaj” na false.

importować pandy
# Utwórz indeks pand, który zawiera 5 ciągów
indeks1 = pandy.Indeks ([i1 ”,„ i1 ”,„ i4 ”,„ i5 ”,„ i4 ”])
Drukuj („Rzeczywisty indeks:”, indeks1)
Drukuj („Unikalny indeks:”, indeks1.Drop_duplicates (keep = false))

Wyjście:

Wyjaśnienie:
Istnieje tylko jeden unikalny indeks - „i5”. Zostaje zwracany przez usunięcie wszystkich duplikatów.

Przykład 3: Z Keep jako pierwszy
Miejmy „indeks1” z 10 wartościami i „indeksem2” z 5 ciągami. Ustaw „Keep” na „pierwszy”, aby upuścić duplikaty bez usunięcia pierwszego wystąpienia.

importować pandy
# Utwórz indeks pand, który zawiera 10 wartości
indeks1 = pandy.Indeks ([45,67,45,89,45,89,12,34,67,89])
Drukuj („Rzeczywisty indeks 1:”, indeks1)
# Upuść duplikaty bez usuwania pierwszego wystąpienia
Drukuj („Unikalny indeks 1:”, indeks1.Drop_duplicates (keep = „First”)))
# Utwórz indeks pand, który zawiera 5 ciągów
indeks2 = pandy.Indeks ([i1 ”,„ i1 ”,„ i4 ”,„ i5 ”,„ i4 ”])
Drukuj („Rzeczywisty indeks 2:”, indeks2)
# Upuść duplikaty bez usuwania pierwszego wystąpienia
Drukuj („Unikalny indeks 2:”, indeks2.Drop_duplicates (keep = „First”)))

Wyjście:

Wyjaśnienie:

  1. W „indeksie 1”, [45, 67, 89, 12, 34] są pierwszym występowaniem unikalnych wartości.
  2. W „indeks2”, [„i1”, „i4”, „i5”] to pierwsze występowanie unikalnych wartości.

Przykład 4: Z Keep As Last
Miejmy „indeks1” z 10 wartościami i „indeksem2” z 5 ciągami. Ustaw „Keep” na „pierwszy”, aby upuścić duplikaty bez usunięcia pierwszego wystąpienia.

importować pandy
# Utwórz indeks pand, który zawiera 10 wartości
indeks1 = pandy.Indeks ([45,67,45,89,45,89,12,34,67,89])
Drukuj („Rzeczywisty indeks 1:”, indeks1)
# Upuść duplikaty bez usuwania ostatniego wystąpienia
Drukuj („Unikalny indeks 1:”, indeks1.Drop_duplicates (keep = „last”))
# Utwórz indeks pand, który zawiera 5 ciągów
indeks2 = pandy.Indeks ([i1 ”,„ i1 ”,„ i4 ”,„ i5 ”,„ i4 ”])
Drukuj („Rzeczywisty indeks 2:”, indeks2)
# Upuść duplikaty bez usuwania ostatniego wystąpienia
Drukuj („Unikalny indeks 2:”, indeks2.Drop_duplicates (keep = „last”))

Wyjście:

Wyjaśnienie:

  1. W „indeksie 1”, [45, 12, 34, 67, 89] są ostatnim występowaniem unikalnych wartości.
  2. W „indeks2”, [„i1”, „i5”, „i4”] to ostatnie występowanie unikalnych wartości.

Wniosek

Ten samouczek opiera się na koncepcji upuszczenia duplikatów indeksów za pomocą modułu pandas. Wykorzystaliśmy pandy „indeks.metoda drop_duplicates () ”. Podaliśmy składnię do wykorzystania tej metody, a także opisali jej parametry. Ta metoda daje nam trzy możliwości radzenia sobie z zduplikowanymi wartościami. Każdy krok w tym artykule jest wyjaśniony bardzo jasno i po prostu.