Pandy qcut

Pandy qcut

„„ Python ”zawiera wiele bibliotek, a kiedy chcemy analizować lub manipulować danymi, używamy tych bibliotek„ Pythona ”, a„ Pandy ”to także jego biblioteka. Biblioteka „Pandy” jest używana w dziedzinie nauk danych, a także jest używana w zajęciach z uczenia maszynowego. Malka danych „Pandy” pomaga nam zapisać dane. W „Pandy”, kiedy chcemy binowanie danych, używamy metody „QCUT ()”. Metoda „QCUT ()” jest wykorzystywana do konwersji cech ciągłych na kategoryczne. Możemy dodać różne typy parametrów w tej metodzie „QCUT ()” do uzyskania różnych rodzajów wyników. W tym samouczku dotyczy metody „qcut ()” i szczegółowo wyjaśnimy metodę „qcut ()” tutaj. Wyjaśnimy wam, w jaki sposób wykonujemy binowanie danych za pomocą funkcji „QCUT ()” w „Pandy” w tym samouczku."

Przykład nr 01

W tych kodach zastosujemy metodę „QCUT ()” i wykonamy te kody w aplikacji „Spyder”. Kiedy musimy pracować z „pandy”, możemy uzyskać dostęp do jej funkcji tylko wtedy, gdy importujemy bibliotekę „Pandy” do naszych kodów. Najpierw umieszczamy „import”, a następnie piszemy „Pandy jako PD”. Teraz musimy zastosować metodę „QCUT ()”, więc w tym celu tworzymy TUTAJ DataFrame. Konstruujemy „Random_df” zawierające „R_ID, R_Name i R_AGE” jako jego kolumny, a także w „R_id”, umieszczamy „R_17, R_21, R_24, R_29, R_31, R_34, R_44, R_46, R_50, R_51, R_55, R_61, R_73 i R_81 ”. Następnie dodajemy „Theodore, Teddy, Noah, Leo, Ivy, Henry, Freddie, Evelyn, Ava, Willow, Theo, Oscar, Jacob i Harper” w kolumnie „R_name” w kolumnie „R_name”. Następnie wstawiamy „21, 33, 12, 43, 22, 7, 21, 51, 72, 19, 10, 9, 37 i 40” w kolumnie „R_age”. Teraz używamy „print ()”, który zawiera „Random_df” i pomoże w renderowaniu „Random_DF”. Właśnie utworzyliśmy ramkę danych i nie stosujemy jeszcze metody „qcut ()”.


Ikona „uruchom” pomaga nam w wykonywaniu kodów. Po naciśnięciu tej ikony „Uruchom”, wynik tego kodu jest wyświetlany na terminalu aplikacji „Spyder”. DataFarme „Random_df” jest pokazany jako wynik kodu, który napisaliśmy w tym przykładzie. Teraz zastosujemy metodę „QCUT ()” i pokażemy również swój wynik.


Tutaj przeliczamy dane. Binujemy kolumnę „R_age” i umieszczamy „PD.metoda qcut () ”, która jest metodą„ pand ”, która pomaga w binowaniu danych. W tej metodzie wstawiamy nazwę DataFrame, a także nazwę kolumny, na której chcemy zastosować tę metodę „QCUT ()”. Ustawiamy również wartość „q” na „5” i służy ona do cięcia danych kolumny „r_age” na pięć równych kwantyli. Dodajemy metodę „QCUT ()” w „print ()”, więc wyświetli również dane biningowe na terminalu.


Tutaj wyświetlane są dane po binowaniu i przecinają „r_age” na pięć kwantyli. Wyświetla również kategorie, w których dane kolumny „r_age” są binowane. Seria kategoryczna reprezentuje pojemniki „r_age”.


Możemy również dostosować etykietę dla tych pojemników. Dodajemy te etykiety pojemników, aby były łatwe do interpretacji. Dodajemy kolumnę „r_age_qcut” do „losowego_df”, w której dodajemy etykiety tych pojemników. Ponownie wykorzystujemy „PD.QCUT () ”metoda ich oznaczania. Dodajemy do niej etykiety, które są „małe, nie tak małe, mierne, wysokie i najwyższe”. Następnie ponownie umieszczamy „Random_df” w „print ()”.


Wszystkie pojemniki są oznaczone i przedstawione w tym wyniku. Kolumna „r_age_qcut” jest wyświetlana w tym ramie danych, w której pokazano oznaczone pojemniki.

Przykład nr 02

Do tworzenia ramki danych najpierw dodajemy „oceny”, które są „3, 6, 8, 7, 2, 5, 1, 9, 4, 7 i 8”. Następnie dodajemy nazwiska studentów w „Studenci”, które są „Peter, Bromley, James, David, Allies, John, James, Samuel, William, Howard i Alexander”. Następnie generujemy „stopni_df”, w którym dodaliśmy „PD.Metoda dataFrame () ”i w tej metodzie umieszczamy„ Std_name ”, która pojawi się jako nazwa kolumny, i przypisujemy do tego wartości„ uczniów ”. Następnie ustawiamy „studenci_Grades” jako nazwę kolumny DataFrame, a także przypisujemy „oceny” tutaj, które stworzyliśmy powyżej. Następnie mamy „print ()”, w którym dodajemy „grades_df” do drukowania.


Rama danych zawierająca dwie kolumny jest wyświetlane w wyniku tego kodu. Teraz zastosujemy metodę „QCUT ()” do kolumny „Students_grades” do wyrównania danych wartości tej kolumny.


Dodajemy tutaj nową kolumnę „klasę”, w której zastosowaliśmy „PD.qcut () ”do kolumny„ studenci_gradowani ”, a także użyliśmy„ 4 ”dla wartości„ q ”, więc przekroczy dane na cztery równe kwantyle. Następnie określamy te kwantyle tutaj, umieszczając wartości w „Q”, które wynoszą „0, .4, .8 i 1 ”. Następnie to również wyświetlamy. Teraz oznaczamy te przerzucone dane, a etykiety, które tutaj dodajemy.


Tutaj dane po binowaniu są wyświetlane tutaj w kolumnie „Grade” i przecinają dane kolumny „Students_grades” na cztery równe kwantyle.


Rama danych, którą otrzymujemy po zastosowaniu metody „QCUT ()” i określeniu kwantyli, jest wyświetlana w tym wyniku.


Teraz, po dodaniu etykiet do tych pojemników, są również renderowane w tym wyniku w kolumnie „klasy” i widać, że przypisuje etykiety zgodnie z wartościami pojemności.

Przykład nr 03

Możemy również zastosować metodę „QCUT ()” do danych pliku CSV. W tym celu najpierw czytamy dane pliku CSV za pomocą metody „read_csv ()”. Czytamy dane „Office2.plik CSV ”, a następnie dane tego pliku są umieszczane w„ Office_df ”. Ta metoda przekonwertuje dane pliku „Office2” na ramkę danych i zapisza je w „Office_df”. Następnie pokazujemy również te dane, umieszczając „Office_DF” w „print ()”. Następnie dodajemy nową kolumnę o nazwie „jednostki_qcut”, do której stosujemy funkcję „PD.qcut () ”do kolumny„ jednostki ”.

Dodatkowo ustawiamy wartość zmiennej „Q” na „5”, która podzieli dane na pięć równych kwantów. Dane po przecięciu na 5 równych kwantyli są przechowywane w kolumnie „jednostki_qcut”, a ta kolumna jest również dodawana do „Office_DF”, a „Office_df” renderowane tutaj ponownie za pomocą „print ()”. Obecnie oznaczamy te binned dane, dodajemy etykiety w metodzie „QCUT ()”, które są „jednostką 1, jednostka 2, jednostka 3, jednostka 4 i jednostka 5”, a także przechowywamy je w kolumnie „etykiety”. Renderujemy również tę strumień danych, w którym dodawana jest kolumna „etykiet”.


Dane, które otrzymujemy po przeczytaniu „Office2.Plik CSV ”jest tutaj renderowany w formie DataFrame. Następnie dodaje się kolumnę „jednostki_qcut”, w której wyświetlane są wartości binned kolumny „jednostki”. Następnie dodaje się również kolumnę „etykiet”, która przypisuje etykiety do tych wartości binowanych. Wszystko odbywa się przy użyciu metody „QCUT ()” w „Pandy”.

Wniosek

W tym samouczku wyjaśniliśmy szczegółowo metodę „QCUT ()”, która pomaga w przestawieniu danych w „Pandy”. Omówiliśmy, że dane są binowane zgodnie z kwantylową wartością „Q”, którą dodaliśmy w metodzie „QCUT ()”, a także dostosowaliśmy etykiety do tych binowanych danych. Zbadaliśmy metodę „QCUT ()” i zastosowaliśmy tę metodę do kolumn z ramki danych, a także zastosowaliśmy tę metodę „QCUT ()” do danych pliku CSV po odczytaniu plików CSV. W tym samouczku przedstawiliśmy wynik wszystkich kodów, aby jasno wyjaśnić i pokazać wynik metody „QCUT ()”.