Pandy dołączają do dwóch ramek danych

Pandy dołączają do dwóch ramek danych

„Pandy jest jednym z pakietów języka Pythona, dzięki czemu analiza danych jest łatwiejsza i elastyczna w pracy i lepsza przetwarzanie. Wiele razy, w prawdziwym życiu, stajemy w obliczu sytuacji, w której wykonaliśmy naszą pracę w wielu różnych plikach, a czasami musimy zobaczyć wszystkie dane razem w jednym „DataFrame”, aby analizować dane zamiast mieć dane w różnych lokalizacjach. Tak więc pandy dostarczają nam tej rzeczy możliwej, ułatwiając nam. Istnieją różne sposoby wykonania tej metody; Będziemy wdrożyć metodę „dołącz” pandy na różne możliwe sposoby. Metoda Join () jest przede wszystkim stosowana i łączy się z ramami danych na podstawie „indeksu”. Będziemy używać narzędzia „Spyder” do implementacji kodów; Jest to oprogramowanie zorientowane na Pyton, które zapewni nam korzyści dla wdrażania kodu Method Pandas ()."

Składnia

"Ramka danych. dołączyć"

Powyższa składnia służy do łączenia dwóch ramek danych. Zawsze działa przy użyciu innego indeksu do celu łączenia. Rzekie danych można zapisać jako „DF”. „Złączenie kropkowe” dotyczy wywołania metody. Ponieważ używa indeksu, ale w prawdziwym nie ma żadnych szkód ani zmian. Realny wskaźnik danych jest zachowany jako oryginał.

Parametr

Później będziemy używać parametru jako „innej” danych danych. Pomaga to w połączeniu dwóch komputerów danych; Połączona rzecz odbywa się z tym parametrem. Ponadto indeks jednego z dwóch „DF” powinien być podobny do dołączenia do nich. Oznacza to, że podobne rodzaje danych lub danych używanych w tym samym celu mogą być razem do przetwarzania.

Poniżej znajdują się różne sposoby, w jakie będziemy robić przykłady wdrożenia metody Join () w „DF”.

  • Metoda łączenia panda przy użyciu indeksów.
  • Metoda łączenia panda przy użyciu kolumn (klucz).
  • Metoda połączenia panda zachowuje oryginalny wskaźnik DataFrame.
  • Metoda łączenia panda przy użyciu nie-Unique (klucz).

Tworzenie ramki danych do implementacji metody łączenia ()

Najpierw musimy zaimportować bibliotekę pand jako „PD”, a następnie będziemy tworzyć ramkę danych składającą się z dwóch kolumn, jedna jest „klucza” jako „t0”, „t1”, „t2”, „t3 ”,„ T4 ”i„ T5 ”, a drugi ma wartości„ n ”jako„ n0 ”,„ n1 ”,„ n2 ”,„ n3 ”,„ n4 ”i„ n5 ”. „DF” reprezentuje ramkę danych w kodzie.

Wyjście pokazuje dane wprowadzone w DataFrame; Widzimy drukowane kolumny „klucz” i „n”.

Tworzenie kolejnej strumienia danych dla metody panda ()

Tworzymy inną ramkę danych, ponieważ będziemy mieć oddzielone ramki danych, a następnie połączymy je za pomocą metody pand (). Rama danych składa się z dwóch kolumn; Gdy tworzymy ostatni „DF”, kolumna „klucz” ma wartości jako „T0”, „T1”, „T2” i „T3”; Z drugiej strony druga kolumna ma wartości „M” jako „M0”, „M1”, „M2”, „M3”.

Oto dane wyjściowe wyświetlające proste tworzenie ramki danych zgodnie z kodem.

Widać, że istnieją dwie ramki danych i chcemy mieć oba razem w tej samej ramce danych, więc będziemy teraz robić przykłady, aby zobaczyć, jak to się stanie.

Przykład nr 01: Metoda Panda łączenia () przy użyciu indeksów

Otwórz narzędzie „Spyder”. Teraz, aby połączyć dwie kompozycje danych, powinniśmy najpierw utworzyć dwieFrame, aby do nich dołączyć. Tutaj Pramki danych składają się ze zmiennych „x” i „y” z wartościami przypisanymi jako „x” z „x0”, „x1”, „x2”, „x3”, „x4” i „x5”, podczas gdy „y”, podczas gdy „y” ma mniej wartości, które to „Y0”, „Y1”, „Y2” i „Y3”. Wartości „kluczowe” pochodzą od „k0” do „k5”, aw innych wartościach „df” są od „k0” do „k2”. Następnie połączenie metody metody „DOT” połączy dwa „DF”. „Sufiks” użyty w kodzie jest dlatego, że w ramce danych istnieją dwie kolumny, które mają tę samą nazwę, i.mi., "klucz". To nie pokrywa się danych.

Wyjście wyświetla dwa „DF” w jednym. Jak widzimy, istnieją pewne wartości jako „nan”, co oznacza, że ​​„nie jest to liczba”. „DF” ma więcej wartości niż drugie „DF”, więc tam, gdzie nie ma przypisanej wartości, pokazuje „NAN”.

Przykład nr 02: Metoda połączenia panda przy użyciu kolumn (klucz)

Jak wiemy teraz, jak dołączyć do dwóch komputerów danych, tutaj zrobimy to za pomocą metody kolumny „klucz”. Kluczowa metoda kolumny układa dane jako kolumny dotyczące ich indeksu. Tutaj oprawa danych składa się ze zmiennych „N” i „W”. „N” ma wartości jako „n0”, „n1”, „n2”, „n3”, „n4” i „n5”. Podczas gdy „W” ma wartości „W0”, „W1” i „W2”. DF z „.Ustaw indeks ”pokazuje„ klucz ”i metodę połączenia wywołującego jako„.dołącz ”, z dołączonym innym indeksem„ DF ”. Ta metoda połączenia połączy zarówno „DF” za pomocą ich indeksu. Jest to bardzo wydajna metoda łączenia pand, która w różny sposób pomoże w środowisku dużych zbiorów danych.

Wyjście przy użyciu metody kolumny indeksu () Pandas pokazuje kolumny o wartościach kluczowych i zmiennych „N” i „W”.

Przykład nr 03: Metoda połączenia panda zachowania oryginalnego indeksu DataFrame

W tym przykładzie będziemy widzieć i udowadniać to, co napisaliśmy powyżej, że dane są zachowane do jego pierwotnego stanu. Tutaj ramki danych mają zmienne „P” i „W”. „P” z wartościami „P0”, „P1”, „P2”, „P3”, „P4” i „P5”. „W” z wartościami „Q0”, „Q1” i „Q2”. „„.dołącz ”implementacja w„ DF ”jest ustawiona z„ indeksem ”(klucz). Ta metoda wyświetli przechowywane dane z indeksem „Oryginalne dane”.

Wyświetlacz reprezentuje prawdziwe dane bez pobrania oryginalności.

Przykład nr 04: Metoda łączenia panda przy użyciu nie-Unique (klucz)

Teraz będziemy robić przykład, aby zrozumieć unikalną metodę. W poprzednim przykładzie dowiedzieliśmy się, jak przechowywane są oryginalne dane. Dokonano tego, pokazując dwie dostępne w kodzie. Będziemy teraz robić to samo, aby sprawdzić oryginalny stan, a także dołączyć do metody z drugim „DF”. „DF” ma tutaj „P” i „Klucz”. „P” ma wartości od „p0” do „p5” ciągłych, a wartości „kluczowe” od „k0” do „k5”. Połączenie metody „kropka” odbywa się z innym „indeksem ustawionym” indukującym „klucz”.

Wyjście jest podobne do wyjścia ostatniego przykładu. Dane są przechwytywane na podstawie oryginalnych danych, które były oryginalne.

Wniosek

Metoda pand łączących dwa dane danych jest wydajne i wygodne. Ta metoda używa „.dołącz ”do funkcji, aby obsługiwać dane i łączyć razem z ramkami danych. Ta metoda jest świetnym sposobem prezentacji danych, zwłaszcza gdy pracujemy nad ogromną ilością danych w katalogu w dowolnym miejscu, w którym przeprowadzana jest analiza danych. Omówiliśmy, w jaki sposób można wdrożyć metodę połączenia panda w celu lepszego zrozumienia funkcji. Zrobiliśmy sposób „indeksowy”, sposób „kolumny” i sposób „kluczowego”, aby wprowadzić dwie różne ramki danych do jednej.