Pand dołącz do scalania

„Pandy” to narzędzie o wysokiej wydajności dla środowiska Python. Jest to „otwarty” kod źródłowy do analizy danych. Przyłączanie pandy i metoda scalania pandy są używane do połączenia dwóch ramek danych razem w jedną ramkę danych. W obu metodach pandy różnica polega na tym, że funkcja „połączenia” pandy łączy się z ramką danych za pomocą indeksu. Podczas gdy funkcja „scalania” pand łączy się z ramką danych za pomocą indeksu i metody kolumny, w której sami możemy wybrać żądaną kolumnę. Metoda scalania pandy jest stosowana głównie w porównaniu z metodą połączenia pandy. Oprogramowanie, których będziemy korzystać do implementacji, to oprogramowanie „Spyder”, które znajduje się w środowisku Python, które zapewni nam korzyści dla wdrożenia kodu metody łączenia pandy () i funkcji metody Method Pandas Method.

Składnia metody pand ()

„DF1.dołącz (DF2) ”

„DF” w powyższej składni jest skrótem „DataFrame”. Istnieją dwie struki danych w składni z funkcją „DOT Złączenie”, która służy wywoływaniu metody. Jest to metoda połączenia z panami dwiema ramkami danych. Działa przy użyciu indeksu do łączenia ram danych w jednym.

Składnia metody pandas merge ()

„DF1.scal (df2, on = 'kolumn_name') "

Składnia metody scalania panda ma dwie struki danych jako „DF1” i „DF2”. Funkcja „scalania kropki” wywołuje metodę łączenia obu ramek z wyglądem odwróconym kolumnami.

Będziemy omawiać następujące sposoby łączenia dwóch ram danych, aby użyć metod scalania pandy i dołączania do pandy:

Metoda łączenia pandy nakładają się.
Pandy dołączają do metody za pomocą resetowania indeksu.
Metoda scalania pandy (kolumna „lewa i prawa”).
Metoda scalania pandy.

Tworzenie ramek danych do wdrożenia metody łączenia pandy i pandy

Najpierw musimy utworzyć ramkę danych. W tym celu będziemy używać narzędzia „Spyder”. Po otwarciu zacznij pisać kod. Importować pandy jako „PD” dla stowarzyszenia biblioteki Pandy. Mamy zmienne DataFrame jako „x”, „y”, „p” i „q odpowiednio i„ a ”z wartościami„ 1 ”i„ b ”o wartości przypisanej jako„ 2 ”.

Dane wyjściowe to „DF” utworzone z przypisanymi wartościami. Możemy to zrobić tak duże jak dane.

Tworzenie kolejnej ramki danych

Musimy zrobić kolejną ramkę danych, aby jasno zrozumieć metody połączenia pand i łączą się pandy. Tutaj „DF” stworzyliśmy to samo co powyższe „DF”, tylko wartości przypisane są zmienne, są różne. Mamy „H”, „J”, „S” i „D”, podczas gdy przypisuje wartości „B” z wartością „8” i „Y” z wartością „3”.

Wyjście pokazuje prosty „DF” utworzony.

Przykład nr 01: Metoda łączenia pand (nakładanie się)

Teraz zobaczymy, jak dołączyć do dwóchframek danych z metodą połączenia pandy. W przypadku tej metody możemy wybrać wybraną kolumnę, nad którą chcemy pracować z DataFrame. Przyjęliśmy przykład z nakładającą się kolumną „po lewej” z „DF”, abyśmy mogli to naprawić za pomocą „sufiksu”, aby przezwyciężyć nakładanie się danych. Tutaj zastosowane zmienne to „x”, „z”, „v”, „d”. „P”, „O”, „L” i „Y” z wartościami przypisanymi jako „3”, „6”, „7” i „9”. „„.dołącz ”wywołuje metodę, z ustawionym na lewym przyłączonym przyrostku z prawym sufiksem„ DF ”. ". „Sufiks” użyty w kodzie jest dlatego, że w ramce danych istnieją dwie kolumny, które mają tę samą nazwę, która jest „kluczem” i która nie pokrywa danych danych.

Wyjście nie wyświetla żadnych nakładających się danych z metodą połączenia dwóch „DF” przy użyciu metody połączenia pandy.

Przykład nr 02: Metoda łączenia pandy przy użyciu resetowania indeksu

W tym przykładzie będziemy osobno określić kolumnę z parametrem „ON”, aby użyć jako „klucza” w metodzie, która pomaga dołączyć do dwóch ramek danych. Połączona rzecz odbywa się z tym parametrem. Ponadto indeks jednego z dwóch „DF” powinien być podobny do dołączenia do nich. Podobne rodzaje danych lub danych używanych w tym samym celu mogą być razem do przetwarzania. Będzie to nadal używać indeksu, używając z prawej strony. Zmienne to „s”, „t”, „u”, „v”, „n”, „w”, „k” i „q”. Przypisane wartości to „3”, „6”, „7” i „9”. „Wskaźnik resetowania kropki” jest metodą pand do zresetowania indeksu „DF”. Indeks resetowania ustawia wszystkie liczby całkowitej listy danych od 0, aż dane z ramki danych zostaną wydłużone.

Oto dane wyjściowe wyświetlane z metodą połączenia indeksu „Key” Pandas.

Przykład nr 03: Metoda scalania panda (kolumna „lewa i prawa”)

Metoda scalania wykonuje podobną operację jak metoda połączenia pandy. Obie metody dotyczą łączenia danych na podobnej ramce danych. Metoda scalania jest bardziej wszechstronna wymagająca określenia klucza. Możemy również określić to w lewej i prawej kolumnie w zależności od pracy z ramką danych. Zmienne w kodzie to „S”, „D”, „G”, „F”, „K”, „J”, „B” i „Q”. Przypisane wartości to „9”, „5”, „6” i „7”. Zewnętrzna implementacja „dołączania” odbywa się zarówno na „DF”, używając parametru „Jak” funkcji metody scalania panda.

Wyjście, które widzimy, pokazuje scalone dane z dwóch ramek danych. „Nan” reprezentuje „nie liczbę”, co oznacza, że tam, gdzie nie ma liczby przypisywanych w danych, pokazuje tam „NAN”.

Przykład nr 04: Metoda scalania jawnie

W tym przykładzie metodą scalania jest zniszczenie indeksu, a wartość indeksu nie jest zakładana w ramce danych. Będziemy wykonywać tę metodę zgodnie z pracą potrzebną do pracy, w której określanie wyraźnych jest kontynuacja. Scali dane na podstawie lewego indeksu lub prawego indeksu z parametrem. Zmienne w tym ramie danych to „t”, „r”, „i”, „u”, „h”, „o”, „e” i „e”. Przypisane wartości to „2”, „4”, „6” i „4”. Powyższy przykład metody scalania panda z wyborem kolumny zgodnie z potrzebą jest najbardziej prezentacja i cenna metoda łączenia dwóch ramek danych. Sprawdzanie na końcu wiersza kodu o unikalnym zestawie klucza scalania w zestawie danych.

W poniższym wyjściu indeks nie jest pokazany bez indeksu, ale funkcja jest wykonywana na podstawie prawego i lewego indeksu.

Wniosek

Metody scal () i Join () są metodami, które są bardzo wygodne i skuteczne. Obie te funkcje są używane do łączenia dwóch osobnych ram danych w tej samej ramce danych, ale mają inny użycie w zależności od przypadku. W tym artykule poznaliśmy kluczowe różnice między metodą dołączania do pand i scalania. Po wykonaniu przykładów i zrozumieniu metody połączenia pandy, zakończymy ją wiedzą, że jeśli chcemy bardziej elastycznego i łączenia stylu bazy danych, preferowane jest przejście z metodą scalania pandy. Z drugiej strony, jeśli chcemy intensywnie połączyć się z indeksem, możemy przejść z funkcją metody pand ().

Windows

Jak otworzyć panel sterowania systemem Windows

5 sposobów przejścia do panelu sterowania Windows 10, 8.1 i Windows 7. Otwarcie panelu sterowania pr...

Hilarion Jarosz

Windows

Poproś o zgodę administratorów

Jak zażądać od administratora zgody na usunięcie folderu lub pliku, jeśli system Windows zgłasza, że...

Pan Ludwik Żak

Windows

Jak pobrać ISO Windows 8.1 (oryginalny obraz)

Oficjalne sposoby Pobierz ISO Windows 8.1 64-bitowy i 32-bitowy z witryny Microsoft. Bezpłatne ładow...

Pan Sara Łapiński