Indeks sortowania pand

Indeks sortowania pand
„Pandy” to jeden z pakietów języka Pythona, który lepiej analizuje dane. Praca z ogromną skalą danych jest gorączkowa i trudna do zarządzania. Ponieważ istnieje wiele czynników, przez które przechodzą dane, jednym z nich jest „sortowanie”. Jednym z kluczowych zadań do wykonania jest sortowanie danych. Pandy mają funkcję do sortowania danych w ramce danych za pomocą ich wartości. Funkcją jest pandas „sort_value”. Pomaga to sortować miliony ilości danych w ciągu kilku minut. W wartości sortowania panów dane są sortowane przez wybór kolumn w kolejności rosnącej lub malejącej. Będziemy omawiać wszystko, w jaki sposób można wykonać wartości sortowania pandy. Będziemy używać narzędzia „Spyder” do implementacji kodu. Ma środowisko językowe w Python.

Składnia

df.sort_values

„DF” w składni jest skrótem „DataFrame”. Powyższa składnia sortuje kolumnę według wartości w ramce danych. Zamiast korzystać z całej ramki danych, działa z określoną etykietą DataFrame. Poniżej przedstawiono metody wartości sortowania pandy, które będziemy wdrażać z przykładami:

  • Wartości zamówienia panda w kolejności rosnącej według określonych kolumn.
  • Wartości sortowania pand według wielu kolumn (przypadek I).
  • Wartości sortowania pandy według wielu kolumn (przypadek II).
  • Pandas sortowani na początku wartości NAN.

Tworzenie ramki danych do wdrożenia wartości sortowania pandy w przykładach

Po otwarciu oprogramowania „Spyder” zaimportuj bibliotekę Pandy jako „PD”. Teraz zacznij tworzyć ramkę danych. Data danych ma dane „samochody”. Mamy nazwy marki: „BM”, „Us”, „HC” i „ZX”. Mamy również ceny tych samochodów, jako „44000”, „32000”, „52000” i „23000” wraz z rokiem produkcji „2018”, „2019”, „2019” i „2020”.

Wyjście pokazuje ramkę danych utworzoną z kolumnami marek samochodów, ich ceny i roku produkcji.

Przykład 01: Wartości zamówienia panda w kolejności rosnącej według określonych kolumn

W tym przykładzie użyjemy funkcji sortowania pandy, aby zamówić wartości danych. Strama danych składa się z modeli samochodów jako „WW”, „XX”, „NN” i „TT” z ich cenami „45000”, „22000”, „33000” i „55000”, a ich lata produkcyjne to „2018 r. ”,„ 2019 ”,„ 2020 ”i„ 2021 ”. Wartości sortowania pandy działają na podstawie ich określonego wyboru kolumny. Tutaj będziemy robić sortowanie na podstawie kolumny „marka”, jak widać w kodzie. Nie napisaliśmy rosnącego w kodzie, ponieważ nie musisz wspominać o tym, jak domyślnie funkcja sortowania pandy wykonuje ją w kolejności rosnącej.

DataFrame wyświetla sortowanie kolumny „marki” w kolejności rosnącej.

Przykład 02: Wartości sortowania pand według wybranej kolumny w kolejności malejącej

W ostatnim przykładzie widzieliśmy, jak sortować wartości w kolejności rosnącej. Nie chcemy, aby dane były zawsze sortowane w rosnącym. Czasami na żądanie, chcemy tego w kolejności malejącej. Teraz będziemy robić, jak sortować wartości w kolejności malejącej. Mamy DataFrame z danymi samochodowymi, takimi jak jej marki: „YY”, „QQ”, „PP” i „BB” z ich cenami „38000”, „45000”, „22000” i „12000”. Mamy lata produkcyjne, a także „2019”, „2020”, „2021” i „2020”. Wybraliśmy tę samą „markę kolumnową” do sortowania jej danych, z nazwami w kolejności malejącej, po prostu dodając warunek „wznoszący się = false”. „In Place = True” w kodzie jest słowem kluczowym, które zmienia domyślne zachowanie w metodzie Pandas.

Dane wyjściowe pokazuje sortowaną DF marki kolumny w kolejności malejącej.

Przykład 03: Wartości sortowania pand według wielu kolumn (przypadek I)

Teraz będziemy robić przykład wartości sortowania pandy w wielu kolumnach. Dane, które mamy jako marki samochodów „LL”, „KK”, „HH” i „GG”. Ich ceny to „45000”, „14000”, „13000” i „56000”, a lata produkcyjne to „2019”, „2020”, „2021” i „2018”. Tutaj wybraliśmy kolumnę „cenę” i „rok”, ponieważ musimy sortować wiele kolumn. Użyliśmy funkcji pand „sort_value” z „df” i kolumn wybranych do sortowania.

Tutaj, w produkcji, widzimy, że kolumna „cena” i „rok” jest pomyślnie sortowana.

Przykład 04: Wartości sortowania pand według wielu kolumn (przypadek II)

W ostatnim przykładzie wykonaliśmy sortowanie danych w wielu kolumnach. Co jeśli dwa lata mają ten sam „rok” produkcji? Tutaj uznamy tę sytuację. Dane są samochodami jako „xx”, „bb”, „ee” i „dd” z ich cenami jako „12000”, „15000”, „19000” i „17000”. Lata produkowanego samochodu to „2021”, „2019”, „2020” i „2020”. Jak widzimy, że „2020” pojawia się dwukrotnie w produkcji. W tej sytuacji, w którym rok powinien być pierwszy w danych, jeśli to pytanie się pojawi? Po prostu przejdzie przez rok, jeśli oba są takie same. Następnie sprawdziłby swoją wartość cenową. Ten, który ma najniższą cenę, będzie pierwsza, a najwyższa pójdzie później. Na podstawie wartości przypisanych danych zadziała, jeśli taka jest tego rodzaju warunek. W kodzie wybraliśmy kolumnę „rok” i „marka”, aby sortować je według wartości sortowania pand.

Wyświetlacz to posortowana wartość zarówno marki, jak i roku. Widzimy tutaj, że rok „2020” pojawia się dwa razy; Najpierw z ceną „17000”, a następnie z ceną „19000”.

Przykład 05: Pandas sortowanie na początku NAN

W tym przypadku zaimportujemy Numpy jako NP. Numpy jest używany do obliczeń numerycznych danych. „Nan” oznacza „nie liczbę”. Tak więc, gdy nie ma numeru przypisanego w danych, które wyskakuje jako „NAN”. Będziemy robić przykład, aby wartości „nan” pojawiają się pierwsze w DataFrame. Funkcja sortowania pandy jest używana z „Na_position” = „First” ”, oznacza to, że pozycja jest ustawiona jako pierwsza z wartości niedostępnych lub zerowych w„ DF ”. Wybraliśmy kolumnę „rok”, aby mieć jej wartości „nan” na górze ramki danych.

Dane wyjściowe pokazuje wartość nan najpierw w kolumnie roku.

Wniosek

Wartość sortowania pandy jest wydajną i bardzo korzystną metodą. W tym artykule omówiliśmy każdą możliwą metodę sortowania wartości w pandy: kolejność wstępująca i malejąca wybrana kolumna DataFrame. Zrobiliśmy sortowanie wielu kolumn, które zrobiliśmy na dwa sposoby: normalny sposób i podobna sytuacja w roku wyglądu. Wreszcie, najpierw sortowaliśmy wartości „NAN” w DataFrame. Każda metoda wartości sortowania pandy jest godna sama, ponieważ praca na ogromnej skali sortowania danych jest trudna i prawie niemożliwa, ta funkcja pand wyniosła ogromny sukces w sortowaniu danych w każdy sposób zgodnie z potrzebą.