Indeks sortowania pand

Indeks sortowania pand
„Pandy” to świetny język do wykonywania analizy danych ze względu na jego wielki ekosystem pakietów Python zorientowanych na dane. Analiza i import obu czynników jest łatwiejszy. Niezależnie od projektu, nad którym pracujemy w dziedzinie nauk danych, musimy zarządzać danymi i chcemy tego w sortowany sposób, aby inne operacje były łatwiejsze i płynne. Aby sortować dane, jest jednym z ważnych reprezentacji zarządzania. Sortowanie danych jest łatwiejsze przy użyciu indeksu, ponieważ pandy mają funkcję „indeks sortowania pand”. Będziemy omawiać wszystkie sposoby sortowania pand za pomocą indeksu. Pandas Sort index () nie tylko sortuje dane według indeksu, ale także dane według wierszy lub kolumn zgodnie z wymogiem. Do wdrożenia kodu będziemy używać oprogramowania „Spyder”, które jest zbudowane w środowisku Python.

Składnia

df.sort_index ()

Powyższa składnia wykonuje sortowanie ramki danych za pomocą indeksu. „DF” to skrót „DataFrame”. Sortowanie danych jest funkcją panda.

Parametry

W indeksie sortowania pandy będziemy używać niektórych parametrów, takich jak „oś”, „poziom”, „wznoszący się”, „zejście” i „ignoruj ​​indeks = true”.

Poniżej znajdują się metody, w których wykonuje się indeks sortowania pandy:

  • Sortowanie pandy według indeksu (kolejność rosnąca).
  • Pandy sortują się według kolejności malejącej.
  • Pandy zresetują indeks w posortowanej ramce danych.
  • Pandy sorują wskaźniki według nazw kolumn lub etykiet.

Tworzenie ramki danych dla metody indeksu sortowania pandy

Najpierw musimy utworzyć ramkę danych do zrozumienia wskaźnika sortowania pandy za pomocą przykładów. Po otwarciu narzędzia „Spyder” do wdrożenia kodu, zacznij pisać kod. Następnie zaimportuj bibliotekę Panda jako „PD” i Numpy jako „NP”. Pandy to platforma typu open source z nagromadzeniem Pythona. Tworząc ramkę danych, mamy „kursy języków”, w których mamy kursy „angielskie”, „NP. nan ”,„ hiszpański ”,„ chiński ”i„ japoński ”.

Mamy dane dotyczące opłat jako „20000”, „13000”, „65500”, „51000”, „51000” i „96000”. Mamy okres ukończenia kursu jako „35 dni”, „50 dni”, „60 dni”, „25 dni” i 63 dni ”. Następnie mamy dane dotyczące rabatu kursów jako „1200”, „2300”, „4500”, „2200” i „1500”.

Oto ekran wyjściowy utworzonej przez nas danych. Wyświetlacz pokazuje, żeFrame odnoszą się do indeksu.

Przykład 01: sortowanie pandy według indeksu (kolejność rosnąca)

Utworzyliśmy powyższą ramkę danych, aby wykonać wszystkie sposoby indeksu sortowania pandy. Tutaj zaimplementujemy indeks sortowania pandy w kolejności rosnącej za pomocą indeksu. Jest wiele razy, kiedy tworzymy ramkę danych, nie zdając sobie sprawy z rozmieszczenia indeksów. W pewnym momencie musimy to rozwiązać, aby wykonać na nim jakąś operację i chcieć w kolejności rosnącej. Pandy mają funkcję „sort_index”, która sortuje wszystkie dane w zależności od indeksu. Tutaj, domyślnie, zostanie wykonana kolejność rosnąca.

Wyjście pokazuje rozstrzygniętą ramkę danych w kolejności rosnącej za pomocą indeksu sortowania pandy. Wartość „121” jest najpierw, a następnie wartości „223”, „323”, „423” i „565”.

Przykład 02: Pandas sortowanie według kolejności malejącej

Jak widzieliśmy w przykładzie nr 02, jak sortować ramkę danych według indeksu sortowania panów w kolejności rosnącej. Teraz będziemy sortować w kolejności malejącej „DF”, stosując metodę sortowania indeksu pandy. DataFrame zawiera dane z języków posiadających kursy i inne potrzeby jako opłaty, czas trwania i rabat oferowane na kursy. Tutaj kolejność malejąca jest wykonywana przez przekazanie parametru „fałsz” do rosnącego w tym samym nawiasie. Ta specyfikacja, aby ustawić nazwę boolean „true” lub „fałszywe” odgrywa istotną rolę w metodzie. Ta funkcja indeksu sortowania pandy wykonuje sortowanie indeksu w kolejności malejącej.

Poniższe dane wyjściowe pokazuje odpowiednio „DF” posortowaną w kolejności malejącej, jak widzimy odpowiednio „565”, „423”, „323”, „223” i „121”.

Przykład 03: Pandy zresetują indeks w posortowanej ramce danych

W tym przykładzie nauczymy się, jak zresetować indeks „DF”, który już został posortowany. Wyjaśnijmy, że jest to po prostu kolejna metoda sortowania ramki danych za pomocą wartości, w zależności od indeksu lub może powiedzieć za pomocą użycia indeksu. Aby zresetować indeks „DF” z tą konkretną metodą, musimy ustawić wartość parametru „ignoruj” jako „true”.

Dane wyjściowe pokazuje, że domyślny indeks zaczyna się od 0 i kontynuuje sortowanie we właściwej kolejności. Sprawi to, że eksploracja danych danych w celu wykonania dowolnego zadania zgodnie z popytem.

Przykład 04: Pandas sortuj indeksów według kolumny (nazwy lub etykiet)

W tym przykładzie będziemy sortować indeksy według etykiet lub kolumn. Często potrzebujemy ramki danych ułożonych przez kolumny, a także sortowane według nazw, abyśmy mogli wykonać inne metody oceny danych, które chcemy. Pandy sortować indeks według kolumny i ponownie ukaż się danych. DF.Sort_Index () Funkcja sortuje obiekty według etykiety z podaną „osą”. „Oś” to parametr, którego używamy.

Celem użycia parametru „Oś” jest to, że sortujemy indeks według kolumny. Czasami musimy sortować indeks według wiersza. Tak więc w tego rodzaju sytuacjach określamy parametr jako oś. Ta metoda działa poprzez zastosowanie etykiet osi do algorytmu sortowania zamiast stosowania go do rzeczywistych danych w ramce danych. W ten sposób dokonuje się przegrupowania danych, a także sortowanie indeksu, oba idą w parze. Ta technika można zastosować do różnych algorytmów sortowania.

Widzimy, że na podstawie nazwy/etykiety kolumny jest kolumna „kursów” na pierwszym miejscu. Następnie „Discount”, „Czas trwania”, a na koniec kolumna „opłaty”.

Wniosek

Indeks sortowania pandy to tak pomocna i wydajna metoda. Ponieważ sortuje to dane według potrzeb, nad którymi chcemy pracować. W tym artykule nauczyliśmy się wszystkich metod, takich jak sortowanie indeksu w kolejności rosnącej i malejącej, sortowanie ramki danych według indeksu i sortowanie indeksu według nazwy kolumny. Nauczyliśmy się również wszystkich parametrów użytych w funkcji Data DataFrame indeksu sortowania pand. Ta metoda jest takim zmieniaczem gier dla osób, które pracują nad ogromnymi ilościami danych, ponieważ sortuje dane zgodnie z potrzebami, abyśmy mogli wykonać analizę i inne prace, które chcemy wykonać.