Połącz Pandas Cross

Połącz Pandas Cross
Python jest dobrze zbudowanym językiem do analizy danych, głównie ze względu na silny ekosystem narzędzi z ukierunkowanego na dane. Pandy ma atrybuty do wykonania połączenia lewego, prawego, wewnętrznego lub zewnętrznego. Ponadto obecnie nie ma techniki wykonania połączenia krzyżowego w celu połączenia lub łączenia dwóch operacji z argumentem how = „cross”. Zrobimy to, wykorzystując metodę pand „Merge ()” w tym artykule z dwoma przykładami.

Metoda pandas merge ()

„PD.Merge () ”można wykorzystać przez następującą podaną składnię:

Tutaj niektóre niezbędne parametry są „lewe”, co oznacza lewą ramkę danych, „prawą”, co oznacza prawą ramkę danych, „jak”, jak dołączyć do ramek danych, „ON”, która odnosi się do kolumny, której użyliśmy do połączenia Dwie ramki danych., oraz „lewy_on” i „prawy_on”, które pomagają w określeniu lewej lub prawej kolumny do połączenia.

Wykonamy kilka praktycznych przykładów, aby wdrożyć tę metodę w tej nauce, aby znaleźć połączenie krzyżowe między dwiema ramkami danych.

Przykład 1: Wykorzystanie pand PD.Metoda merge (), aby uzyskać połączenie krzyżowe między dwiema ramkami danych za pomocą jednej kolumny

Począwszy od pierwszej ilustracji praktycznej implementacji kodu Pythona do wykonania połączenia krzyżowego w Pandas DataFrame, musimy poszukać narzędzia lub oprogramowania, które może uruchomić nasze kody Pythona. Wiele narzędzi obsługuje język Python. Spośród tych różnych wyborów wybieramy narzędzie „Spyder”. Najpierw musimy zainstalować konfigurację narzędzia „Spyder”. Po zakończeniu uruchamiamy narzędzie. Otwórz nowy plik, klikając przycisk „Plik”, naciskając symbol pliku lub naciskając klawisze „Ctrl+N”.

Nasz nowy plik z „.Rozszerzenie PY ”, które odnosi się do„ Python ”jest gotowe do rozpoczęcia pracy. Skoncentrujmy się teraz na kodzie. Można zauważyć, że pierwszym słowem tytułu naszego artykułu jest „Pandy”, co oznacza, że ​​coś zostanie zrobione przy użyciu biblioteki „Pandy”. Rozumiemy, że naszym warunkiem wdrożenia tego kodu jest zaimportowanie biblioteki pand do pliku Python. Napisaliśmy linię kodu „Importuj pandy jako PD”. To importuje wszystkie funkcje biblioteki pandy. Użyliśmy również „jako PD”, co oznacza, że ​​gdziekolwiek musimy uzyskać dostęp do dowolnej metody pand w tym kodzie, musimy napisać „PD” zamiast pisać pełną formę „Pandy”.

Gdy wykonujemy połączenie krzyżowe, musimy mieć dwie pandas, w których ćwiczymy tę metodę. Dowiesz się tutaj, jak skonstruować zdefiniowaną przez użytkownika DataFrame. Aby utworzyć ramkę danych, pandy daje nam „PD.Funkcja dataFrame () ”, w której„ PD ”to„ pandy ”. Tak więc uzyskujemy dostęp do metody panda. „DataFrame ()” jest słowem kluczowym tej funkcji, które po wywołaniu generuje ramkę danych. Tworzymy ramkę danych za pomocą tego „PD.DataFrame () ”i zainicjuj ją za pomocą jednej kolumny„ NUM ”. Ta kolumna zawiera dwie wartości, które wynoszą „4” i „5”. Nazywanie „PD.Metoda dataFrame () ”generuje ramkę danych z tymi dostarczonymi wartościami.

Teraz, aby przechowywać tę strumień danych, tworzymy obiekt „V1”. Nowo wygenerowana ramka danych jest teraz dostępna dla tej zmiennej „V1”. Aby zobaczyć tę ramkę danych na terminalu, stosujemy metodę „print ()”. Następnie tworzymy naszą drugą ramkę danych, wykonując te same kroki wspomniane podczas tworzenia pierwszej ramki danych „V1”. Wywołać „PD.DataFrame () ”Aby utworzyć ramkę danych zainicjowaną przez jedną kolumnę z trzema wartościami„ r ”,„ s ”i„ t ”. Aby przechowywać tę ramkę danych, tworzymy zmienną „v2”. Aby wyświetlić „V2” DataFrame, ponownie wykorzystujemy metodę „print ()”.

Jeśli jesteś nowy w narzędziu „Spyder”, możesz zastanawiać się, jak uruchomić kod. Aby wykonać ten plik Python, kliknij przycisk „Uruchom plik” lub naciśnij klawisze „Shift+Enter”. Teraz możesz zobaczyć dwie, które właśnie utworzyliśmy, które są wyświetlane na terminalu narzędzia „Spyder”.

Główne zadanie zaczyna się stąd. Musimy teraz zastosować połączenie krzyżowe w obu tych ramach danych. Aby wykonać połączenie krzyżowe na dwóch ramach danych, musi istnieć jakaś kolumna „kluczowa”, która jest obecna w obu ramach danych, aby utworzyć łącznik między nimi, abyśmy mogli je scalić za pomocą tego. Jak widzimy, nie ma tego, więc dodajemy teraz jedno w ramach danych „v1” i „v2”, co jest wspólną kolumną. Dodajemy tę samą kolumnę „klawisz” do obu ram danych jako „v1 ['key] = 0” i „v2 [' key '] = 0”. Teraz możemy je połączyć w tej kolumnie „klucz”.

Aby je połączyć, używamy „PD.Metoda scal () ”. Pomiędzy jego nawiasami zapewniamy zarówno „V1”, jak i „V2”. Parametr „On” prosi nas o podanie wspólnej nazwy kolumny na podstawie tego, na którym możemy je połączyć. Wygląda więc na „on =„ klucz ””. Dzięki tej funkcji używamy „.Drop () ”metoda upuszczenia kolumny„ klucz ”po wykonaniu scalania. Funkcja „Drop ()” ma dwa parametry - nazwa kolumny „klucz” i „osi = 1”, co oznacza, że ​​kropla jest pod względem kolumny. Tworzymy zmienną „przechowujemy”, aby przechowywać wyjście „PD.funkcja scal () ”. Nazywamy metodę „print ()”, aby zobaczyć wyjście.

Wykonanie danego programu daje nam ramkę danych, która ma wszystkie możliwe kombinacje wierszy z danej ramki danych.

Przykład 2: Wykorzystanie pand PD.Metoda merge (), aby uzyskać połączenie krzyżowe między dwiema ramkami danych z wieloma kolumnami

Wykonamy kolejny przykład tutaj na ten sam temat, połączenie Pandas Cross. W tym celu uruchamiamy nasze narzędzie „Spyder” i otwieramy nowy plik, naciskając „Ctrl+N”. Najważniejszym wymogiem kodu jest import niezbędnych bibliotek. Korzystamy z metody pandas, więc importujemy bibliotekę pand jako PD. Teraz konstruujemy naszą pierwszą ramkę danych przy użyciu „PD.Metoda dataFrame () ”.

Zainicjujemy tę ramkę danych z dwiema kolumnami - „kolor” i „num”. Kolumna „kolor” zawiera trzy wartości, które są „czerwone”, „zielone” i „niebieskie”. Podczas gdy kolumna „NUM” ma taką samą długość wartości, które wynoszą „101”, „110” i „100”. Tworzymy zmienną „P1” do przechowywania wyjścia wywołania „PD.Metoda dataFrame () ”. Teraz możemy uzyskać ramkę danych za pomocą tej zmiennej. Zastosujemy funkcję „print ()”, aby wyświetlić pierwszą ramkę danych na terminalu.

Nasza pierwsza ramka danych została pomyślnie utworzona. Polecamy teraz drugą ramkę danych. Znowu używamy „PD.Metoda dataFrame () ”i utwórz kolumnę w jej nawiasach. Ta kolumna „szereg” przechowuje cztery wartości. Wartości te to „C1”, „C2”, „C3” i „C4”. Aby przechowywać tę ramkę danych, tworzymy zmienną „P2”. Następnie wywołujemy funkcję „print ()”, aby wyświetlić ramkę danych „P2”.

Uruchamianie poprzedniego kodu Pythona daje nam następujące dane wyjściowe, które wyświetla 2Frame:

Generujemy kolumnę „klucz” w każdej ramce danych, w której możemy je scalić. Tutaj używamy wartości „2” zarówno dla kolumn „P1 [„ Key ”]”, jak i „p2 [„ klucz ”]”. Wreszcie przywołujemy „PD.funkcja merge () ”, aby scalać struki danych na podstawach kolumny„ klucz ”. i „.metoda zrzutu () ”do usunięcia kolumny„ klucz ”po połączeniu obu ramek danych. Tworzymy zmienną „malowanie” do przechowywania połączonej ramki danych. „Print ()” jest wykorzystywany do wyświetlania końcowej jazdy na krzyżowo-ramy danych przechowywanej w „Paint”.

To prowadzi nas do następujących wyświetlanych pojedynczych krzyżowych ramek danych wygenerowanych z scalania dwóch ram danych.

Wniosek

Połączenie dwóch ram danych w jedną przełomową ramkę danych jest bardzo łatwą i ważną techniką do nauki. W tym artykule podkreślono i wyjaśniono pojęcie połączenia krzyżowego w PandaS DataFrame. Opracowaliśmy każdy drobny szczegół, od pobierania wymaganego narzędzia do osiągnięcia pożądanego wyjścia. Poprzez praktyczne przykłady kodów Python zaimplementowanych i wykonanych na narzędziu „Spyder”, dołożyliśmy celowego wysiłku, aby wnieść owocne uczenie się i łatwą do zrozumienia pojęcie pand Pythona.