Pandas NLIELD

Pandas NLIELD
„Pandy” to biblioteka, która pomaga nam w wykonaniu wielu zadań łatwo i wydajnie. Możemy używać biblioteki „pandy”, gdy tylko potrzebujemy manipulowania, a także analizować dane. „Pandy” zapewnia również możliwość utworzenia strumienia danych. Rama danych jest generowana przy użyciu metody „pandy”. Możemy również znaleźć największą wartość kolumn DataFrame. Kiedy wprowadzamy dane liczbowe w kolumnie DataFrame, znajdujemy również największe wartości obecne w tej kolumnie za pomocą metody „pandy”. Metodą, którą możemy wykorzystać do znalezienia największych wartości w kolumnach ramki danych, jest metoda „nLategest ()”. W tym przewodniku użyjemy tej „największej” metody w kodach „pandy” i wyjaśnimy, że działa tutaj.

Składnia:
Ramka danych.NLANDANIE (n, kolumny, keep = „First”)

„N” reprezentuje liczbę największych wartości, które chcemy uzyskać z kolumn DataFrame. Następnie, zamiast parametru „kolumn”, umieszczamy nazwę kolumny, z której chcemy uzyskać największe wartości. Następnie, w parametrze „Keep”, możemy dodać „Najpierw” lub „Last”. „Pierwszy” służy do wyświetlania pierwszej wartości zduplikowanych wartości, a „ostatni” służy do wyświetlania ostatniej wartości duplikatów.

Przykład 1:

Początkowy kod tego przewodnika jest tutaj. Wszystkie skrypty, które obejmujemy w tym przewodniku, są gotowe za pomocą narzędzia „Spyder”. Za każdym razem, gdy chcemy napisać nowy kod „pandy” importujemy kilka modułów „pandy”. Można je importować, po prostu napisanie „pandy jako PD” po słowach kluczowych „import”, co tutaj robimy. Teraz, wkładając „PD” do tego kodu, otrzymujemy dostęp do funkcji „pandy”. Teraz projektujemy tutaj ramkę danych, umieszczając „PD.Ramka danych()".

Projektujemy ramkę danych „NUM_DF” i umieszczamy w niej trzy kolumny. „COLA” to pierwsza kolumna, którą tworzymy w tym ramie danych. „Cola” ma w sobie „10, 4, 6, 9 i 18”. Po „cola” dodajemy drugą kolumnę „Colb”, w której dodajemy również liczby, które są „13, 28, 48, 12 i 11”. Następnie ostatnia kolumna, którą tutaj wstawiamy, to kolumna „Colc”. W kolumnie „Colc” umieściliśmy „21, 24, 31, 44 i 59”. Wszystkie kolumny wraz z niektórymi danymi są wstawiane do „NUM_DF”.

Teraz używamy „print ()” i przekazujemy „num_df” do tej funkcji. To wyświetla „num_df” na terminalu. Chcemy uzyskać trzy największe wartości z kolumny „cola” tej formy danych. W tym celu wykorzystujemy metodę „NLANDASTAL ()” i przekazujemy „3” jako pierwszy parametr, który reprezentuje liczbę największych wartości, które chcemy uzyskać. Następnie piszemy „cola”, ponieważ chcemy uzyskać największe wartości kolumny „cola” i przechowywać te największe wartości w „dużej” zmiennej. Następnie drukujemy te wartości. Tak więc ponownie używamy „print ()”, która zawiera w niej „dużą” zmienną. Te trzy największe wartości „cola” są wyświetlane na terminalu.

Po osiągnięciu klawiszy „Shift+Enter” lub naciśnięciu ikony biegu, możemy łatwo uzyskać wynik kodów „pandy” w „Spyder”. Rzeka danych jest tutaj w tym wyniku, który zawiera wszystkie dane, które do niego dodamy. Następnie, w poniższej strumieniu danych, wyświetlane są trzy wiersze. Są to „3” największe wartości „cola”, które są tutaj renderowane w kolejności malejącej.

Przykład 2:

„Gym_df” jest zaprojektowany w tym kodzie, w którym dodajemy „wagi” i „wagi” jako jego kolumny. W kolumnie „Weight_loser” dodaje się „Theo, Harper, Oscar, Sue, Grace, Jayden, Larry i Taylor”. Następnie mamy kolumnę „Wagi”, w której umieszczamy ciężary, które wynoszą „99, 101, 119, 89, 102, 85, 86 i 120”. Teraz nazywamy „print ()” i podajemy argument „gym_df”. To powoduje, że terminal pokazuje „siłownia_ DF”. Chcemy uzyskać największą liczbę „4” kolumny „wagi” tego ramki danych.

Aby to osiągnąć, używamy metody „NLANDASTAL ()” i przekazujemy liczbę „4” jako pierwszy parametr, który oznacza liczbę największych wartości, które chcemy uzyskać. Następnie wpisujemy „wagi”, aby zdobyć największe wartości kolumny „wagi”. Oszczędzamy również te największe wartości w zmiennej „dużej_wadze”. Wartości należy następnie wydrukować. Dlatego ponownie używamy „print ()”. Obejmuje zmienną „duże_wadze”. Terminal pokazuje „wagi” cztery największe wartości.

Po oryginalnych danych największe cztery wartości kolumny „Wagi” są wyświetlane w postaci kolejnej nowej ramki danych. W kodzie otrzymujemy te cztery największe wartości przy użyciu metody „nLategest ()”.

Przykład 3:

W tym przykładzie czytamy plik CSV za pomocą metody „read_csv” i tworząc ramkę danych z pliku CSV. Przechowujemy tę ramkę danych w zmiennej „data_df”. Teraz używamy metody „dropna ()”, w której dostosowujemy parametr „ince” do „true”. To usuwa te wiersze, w których pojawia się wartość zerowa. Następnie otrzymujemy metodę „NLANDAST ()” i dodajemy „5”, ponieważ chcemy uzyskać pierwsze pięć największych wartości kolumny „jednostki”. Te pięć największych wartości jest przechowywane w zmiennej „największej 5”. Ten „największy 5” jest umieszczony w „print ()” do wyświetlania.

Wyświetla wszystkie dane pliku CSV tutaj jako komputer danych po przeczytaniu. Następnie otrzymuje pierwsze pięć największych wartości „jednostek” i wypiera je w tym wyniku.

Przykład 4:

Ten kod tworzy „sales_df” i dodaje do niego kolumny „sprzedawca” i „sprzedaż/dzień”. „ABC, ABD, ABE, ABF, ABG, ABH, ABI, ABJ, ABK i ABL” są teraz wymienione w kolumnie „Sprzedawca”. Kolumna „Sprzedaż/dzień” następuje, gdzie wymieniamy następujące ceny sprzedaży: „60000, 25000, 30000, 18000, 29000, 21000, 40000, 54000, 33000 i 41000”. Teraz umieszczamy „print ()” z argumentem „sales_df”. W rezultacie ta „sales_df” pojawia się w terminalu. „4” największe liczby w kolumnie „Sprzedaż/dzień” tego napięcia są tym, co chcemy uzyskać z tego ramki danych.

Do tego stosuje się metoda „nLategest ()”. Pierwszy parametr, który reprezentuje liczbę największych wartości, które chcemy otrzymać, to „4”, który jest tutaj dodany. Następnie dodajemy nazwę kolumny, z której chcemy uzyskać dostęp do największych wartości. Nazwa tej kolumny to kolumna „sprzedaż/dzień”. Dodajemy tę metodę „nlANIEL ()” w „print ()”, więc jest ona również wyświetlana na terminalu.

Ten wynik zawiera ramkę danych ze wszystkimi danymi, które przyczyniliśmy się do niego w kodzie. Następnie cztery wiersze pokazano w poniższej ramce danych. Są to „4” największe wartości kolumny „sprzedaż/dzień”. Są one wyświetlane w kolejności malejącej w następującej ilustracji:

Wniosek

Ten przewodnik całkowicie opisał szczegółowo metodę „nLandest ()”. Nauczyliśmy się szczegółowo składni tego przewodnika, a także użycia tej metody. Omówiliśmy parametry tej metody dogłębnie, a także zastosowaliśmy tę metodę „NLANIEL ()” w kodzie „Pandy”, aby pokazać działanie tej metody „NLANDALNE ()”. Wyjaśniliśmy, jak wspomnieć o liczbie największych wartości, które chcemy uzyskać, a także nazwę kolumny, aby uzyskać największe wartości „N” z kolumny DataFrame. Wyjaśniliśmy również, jak uzyskać największe wartości z pliku CSV po odczytaniu danych z pliku CSV w tym przewodniku.