Pand dołącz do scalania

Pand dołącz do scalania

„Pandy” to narzędzie o wysokiej wydajności dla środowiska Python. Jest to „otwarty” kod źródłowy do analizy danych. Przyłączanie pandy i metoda scalania pandy są używane do połączenia dwóch ramek danych razem w jedną ramkę danych. W obu metodach pandy różnica polega na tym, że funkcja „połączenia” pandy łączy się z ramką danych za pomocą indeksu. Podczas gdy funkcja „scalania” pand łączy się z ramką danych za pomocą indeksu i metody kolumny, w której sami możemy wybrać żądaną kolumnę. Metoda scalania pandy jest stosowana głównie w porównaniu z metodą połączenia pandy. Oprogramowanie, których będziemy korzystać do implementacji, to oprogramowanie „Spyder”, które znajduje się w środowisku Python, które zapewni nam korzyści dla wdrożenia kodu metody łączenia pandy () i funkcji metody Method Pandas Method.

Składnia metody pand ()

„DF1.dołącz (DF2) ”

„DF” w powyższej składni jest skrótem „DataFrame”. Istnieją dwie struki danych w składni z funkcją „DOT Złączenie”, która służy wywoływaniu metody. Jest to metoda połączenia z panami dwiema ramkami danych. Działa przy użyciu indeksu do łączenia ram danych w jednym.

Składnia metody pandas merge ()

„DF1.scal (df2, on = 'kolumn_name') "

Składnia metody scalania panda ma dwie struki danych jako „DF1” i „DF2”. Funkcja „scalania kropki” wywołuje metodę łączenia obu ramek z wyglądem odwróconym kolumnami.

Będziemy omawiać następujące sposoby łączenia dwóch ram danych, aby użyć metod scalania pandy i dołączania do pandy:

  • Metoda łączenia pandy nakładają się.
  • Pandy dołączają do metody za pomocą resetowania indeksu.
  • Metoda scalania pandy (kolumna „lewa i prawa”).
  • Metoda scalania pandy.

Tworzenie ramek danych do wdrożenia metody łączenia pandy i pandy

Najpierw musimy utworzyć ramkę danych. W tym celu będziemy używać narzędzia „Spyder”. Po otwarciu zacznij pisać kod. Importować pandy jako „PD” dla stowarzyszenia biblioteki Pandy. Mamy zmienne DataFrame jako „x”, „y”, „p” i „q odpowiednio i„ a ”z wartościami„ 1 ”i„ b ”o wartości przypisanej jako„ 2 ”.

Dane wyjściowe to „DF” utworzone z przypisanymi wartościami. Możemy to zrobić tak duże jak dane.

Tworzenie kolejnej ramki danych

Musimy zrobić kolejną ramkę danych, aby jasno zrozumieć metody połączenia pand i łączą się pandy. Tutaj „DF” stworzyliśmy to samo co powyższe „DF”, tylko wartości przypisane są zmienne, są różne. Mamy „H”, „J”, „S” i „D”, podczas gdy przypisuje wartości „B” z wartością „8” i „Y” z wartością „3”.

Wyjście pokazuje prosty „DF” utworzony.

Przykład nr 01: Metoda łączenia pand (nakładanie się)

Teraz zobaczymy, jak dołączyć do dwóchframek danych z metodą połączenia pandy. W przypadku tej metody możemy wybrać wybraną kolumnę, nad którą chcemy pracować z DataFrame. Przyjęliśmy przykład z nakładającą się kolumną „po lewej” z „DF”, abyśmy mogli to naprawić za pomocą „sufiksu”, aby przezwyciężyć nakładanie się danych. Tutaj zastosowane zmienne to „x”, „z”, „v”, „d”. „P”, „O”, „L” i „Y” z wartościami przypisanymi jako „3”, „6”, „7” i „9”. „„.dołącz ”wywołuje metodę, z ustawionym na lewym przyłączonym przyrostku z prawym sufiksem„ DF ”. ". „Sufiks” użyty w kodzie jest dlatego, że w ramce danych istnieją dwie kolumny, które mają tę samą nazwę, która jest „kluczem” i która nie pokrywa danych danych.

Wyjście nie wyświetla żadnych nakładających się danych z metodą połączenia dwóch „DF” przy użyciu metody połączenia pandy.

Przykład nr 02: Metoda łączenia pandy przy użyciu resetowania indeksu

W tym przykładzie będziemy osobno określić kolumnę z parametrem „ON”, aby użyć jako „klucza” w metodzie, która pomaga dołączyć do dwóch ramek danych. Połączona rzecz odbywa się z tym parametrem. Ponadto indeks jednego z dwóch „DF” powinien być podobny do dołączenia do nich. Podobne rodzaje danych lub danych używanych w tym samym celu mogą być razem do przetwarzania. Będzie to nadal używać indeksu, używając z prawej strony. Zmienne to „s”, „t”, „u”, „v”, „n”, „w”, „k” i „q”. Przypisane wartości to „3”, „6”, „7” i „9”. „Wskaźnik resetowania kropki” jest metodą pand do zresetowania indeksu „DF”. Indeks resetowania ustawia wszystkie liczby całkowitej listy danych od 0, aż dane z ramki danych zostaną wydłużone.

Oto dane wyjściowe wyświetlane z metodą połączenia indeksu „Key” Pandas.

Przykład nr 03: Metoda scalania panda (kolumna „lewa i prawa”)

Metoda scalania wykonuje podobną operację jak metoda połączenia pandy. Obie metody dotyczą łączenia danych na podobnej ramce danych. Metoda scalania jest bardziej wszechstronna wymagająca określenia klucza. Możemy również określić to w lewej i prawej kolumnie w zależności od pracy z ramką danych. Zmienne w kodzie to „S”, „D”, „G”, „F”, „K”, „J”, „B” i „Q”. Przypisane wartości to „9”, „5”, „6” i „7”. Zewnętrzna implementacja „dołączania” odbywa się zarówno na „DF”, używając parametru „Jak” funkcji metody scalania panda.

Wyjście, które widzimy, pokazuje scalone dane z dwóch ramek danych. „Nan” reprezentuje „nie liczbę”, co oznacza, że ​​tam, gdzie nie ma liczby przypisywanych w danych, pokazuje tam „NAN”.

Przykład nr 04: Metoda scalania jawnie

W tym przykładzie metodą scalania jest zniszczenie indeksu, a wartość indeksu nie jest zakładana w ramce danych. Będziemy wykonywać tę metodę zgodnie z pracą potrzebną do pracy, w której określanie wyraźnych jest kontynuacja. Scali dane na podstawie lewego indeksu lub prawego indeksu z parametrem. Zmienne w tym ramie danych to „t”, „r”, „i”, „u”, „h”, „o”, „e” i „e”. Przypisane wartości to „2”, „4”, „6” i „4”. Powyższy przykład metody scalania panda z wyborem kolumny zgodnie z potrzebą jest najbardziej prezentacja i cenna metoda łączenia dwóch ramek danych. Sprawdzanie na końcu wiersza kodu o unikalnym zestawie klucza scalania w zestawie danych.

W poniższym wyjściu indeks nie jest pokazany bez indeksu, ale funkcja jest wykonywana na podstawie prawego i lewego indeksu.

Wniosek

Metody scal () i Join () są metodami, które są bardzo wygodne i skuteczne. Obie te funkcje są używane do łączenia dwóch osobnych ram danych w tej samej ramce danych, ale mają inny użycie w zależności od przypadku. W tym artykule poznaliśmy kluczowe różnice między metodą dołączania do pand i scalania. Po wykonaniu przykładów i zrozumieniu metody połączenia pandy, zakończymy ją wiedzą, że jeśli chcemy bardziej elastycznego i łączenia stylu bazy danych, preferowane jest przejście z metodą scalania pandy. Z drugiej strony, jeśli chcemy intensywnie połączyć się z indeksem, możemy przejść z funkcją metody pand ().