Pandas scal się według indeksu

Pandas scal się według indeksu
Procedura łączenia dwóch zestawów danych w jedną i wyrównania wierszy zgodnie ze współdzielonymi atrybutami lub kolumnami jest znana jako „Pandy Merge ()”. Korzystając z operacji połączenia w stylu bazy danych, dwa obiekty DataFrame są łączone przy użyciu funkcji Pandas DataFrame „Merge ()”. Dwuwymiarowa struktura danych o nazwie Pandas DataFrame jest wyrównana w formacie tabelarycznym. Istnieje wiele sposobów zintegrowania tych ramek danych, w tym „dołącz ()” i „Merge ()”. Procedury połączenia i wybitne wydajność Pandy są porównywalne z procedurami relacyjnej SQL. Operacje dołączania między obiektami DataFrame można wykonać za pomocą funkcji „Merge ()”. W kolumnach lub indeksach połączenie jest gotowe. Indeksy nie są brane pod uwagę przy łączeniu kolumn. Źródłowe obiekty DataFrame są nietknięte, a ta funkcja zwraca nową ramkę danych.

Chociaż są one używane w różnych sytuacjach, pandy „dołącz” i „scalanie” są używane do przeprowadzania połączeń na pandasframe. Podczas gdy procedura „Merge ()” jest bardziej elastyczna i pozwala dołączyć do danych danych zarówno w indeksach, jak i kolumnach, funkcja łącza () jest zwykle używana do łączenia danych danych w indeksie. „Left_Index” jest używany jako klucz połączenia i „prawy _Index”, który wykorzystuje indeks z „PRAWA RAMED”, jest używany jako drugi klucz łącza. Technikę „dołącz ()” można zastosować do dołączenia do lewej ramki danych do kolumny, ale właściwa ramka danych wymaga, aby została dołączona do jego indeksu.

Składnia do łączenia dwóch ram danych według indeksu za pomocą metody merge ()

Korzystając z tej składni, dwie kompozycje danych można łączyć na podstawie ich indeksów.

Składnia do połączenia dwóch ram danych według indeksu za pomocą metody łączenia ()

Przykład 1: Korzystając z ich indeksu, funkcję Merge () można użyć do połączenia dwóch ramek danych.

Panda to moduł do przetwarzania danych. Dane tabelaryczne mogą być przechowywane w Python za pomocą ramki danych. Możesz szybko przechowywać i pracować z danymi tabelarnymi, takimi jak wiersze i kolumny, za pomocą DataFrame. Pandy oferują różnorodne udogodnienia do łączenia serii lub danych danych z różnymi rodzajami ustalania rozumowania dla indeksów i możliwości matematyki strukturalnej w przypadku operacji dołączania lub scalania.

W tym przykładzie użyjemy funkcji „Merge ()”, aby dołączyć do dwóch ram danych, dopasowując ich wartości indeksu. W tym przykładzie tworzone są dwie ramki danych. Pierwsza strumienia danych ma dwie kolumny i nazywa się „Data1”. „Wiek” i „Nazwy” to kolumny „Data1”. Mamy listę wartości w każdej kolumnie. Wartości „wieku” mamy „28”, „37”, „29” i „32” oraz dla kolumny „nazwa” mamy „George”, „James”, „Arthur” i „Henry”. W tym ramie danych rozmiar indeksu wynosi „4”. Indeks „id” to „1”, „2”, „3” i „4”. Informacje indeksu danych są zwracane za pośrednictwem właściwości indeksu. Etykiety do wierszy są zawarte w informacjach indeksu. Właściwość indeksu wytwarza obiekt indeksu zakresu z wartościami początkowymi, końcowymi i fazowymi, jeśli wiersze nie mają wymienionych indeksów.

Następnie tworzymy kolejną ramkę danych „Data2”. Ma dwie kolumny „id” i „zawód”. W tych dwóch kolumnach mamy listę wartości. W kolumnie „ID” mamy „1”, „2”, „3” i „4” . Kolumna „Zawód” ma „Doktor” i „Nauczyciel” i „Inżynier”. Następnie wspominamy tutaj indeks „1”, „2”, „3”, „6” i „7”.

Teraz używamy funkcji „Merge ()”, aby dołączyć do dwóch ramek danych, „Data1” i „Data2”. Używane są dwa parametry funkcji scalania: „left_index = true” i „prawy_index = true. Z danych danych należy wybrać niektóre wiersze i kolumny danych. Jako połączony klawisz „lewy indeks” jest wykorzystywany z lewej strony danych i innego klawisza Connect. „Right _Index” wykorzystuje indeks z prawej strony danych.

Indeksowanie to proces wybierania wszystkich wierszy i niektórych kolumn, niektórych wierszy i wszystkich kolumn lub kawałka każdego wiersza i każdej kolumny. Inną nazwą indeksowania jest wybór podzbioru. „Merge ()” to funkcja, której potrzebujesz, gdy chcesz połączyć elementy danych na podstawie jednego lub większej liczby klawiszy, podobnie jak w relacyjnej bazie danych. Łączenie wierszy, szczególnie z podobnymi danymi, najlepiej osiągnąć funkcję „Merge ()”. Teraz połączy dwieFrame Data, dopasowując ich adres indeksu i wyświetli je na ekranie za pomocą funkcji „print ()”.

W tym przykładzie pokazano na obrazie wyjściowym. Tak więc, gdy funkcja scalania dołącza do dwóch ramek danych, widzimy, że wyświetlono tylko wartości, których dopasowane adresy indeksu były. Nie można było wyświetlić dwóch ostatnich wierszy drugiej ramki danych i czwartego wiersza pierwszej ramki danych. Rozmiar ramki danych, który mamy teraz, wynosi trzy po użyciu scalania w indeksie.

Przykład 2: Aby połączyć dwieFrame Data w zależności od ich indeksów, użyj funkcji Join ().

Są sytuacje podczas scalania dwóch ramek danych produkującej ramkę danych z wzorem indeksu, który nie spełnia naszych wymagań. Chcemy zmodyfikować indeks wynikający z scalania. Podczas połączenia ram danych zresetujemy indeks z tego powodu. Najmniejsza ilość kontroli jest możliwa z tą funkcją w oparciu o współdzieloną kolumnę lub indeks, wiersze z dwóch tabel zostaną połączone.

Dla naszego drugiego przykładu, który jest podobny do pierwszego, ten program ma dwie ramki danych „DF1” i „DF2”. Mamy dwie kolumny „nazwy” i „znaki” w pierwszej ramce danych. Wartości, które mamy w pierwszej kolumnie, to „Emma”, „Watson”, „Jhon”, „Lilly”, „Edward”, „Noah”, „Smith” i „Enna” oraz wartości w kolumnie „Znaki” są „25”, „20”, „14”, „16”, „27”, „20”, „12” i „15”. Następnie mieliśmy listę indeksu „A”, „B”, „C”, „D”, „E”, „F”, „G” i „H”. Podobnie istnieją dwie kolumny w drugiej „Temat” i „Uwagi” i „uwagi”. W kolumnie „Temat” mamy listę tematów, która obejmuje „OOP”, „PF”, „Python”, „Java”, „PHP” i „Rachunek” i mamy listę komentarzy w kolumnie „Uwagi” w kolumnie „Uwagi” które są albo „przejście” lub „upadek”. Lista indeksu drugiej formy danych to „A” „C”, „D”, „G”, „M” i „N”.

Następnie, w oparciu o indeksy dwóch ramek danych, scalamy je za pomocą techniki „łączenia ()”. Strategia łączenia działa najlepiej podczas łączenia ramek danych w ich indeksach, nawet jeśli możemy wybrać kolejną kolumnę dla lewej strony danych, aby dołączyć. Oprócz umożliwienia nam dostarczania kolumn innych niż indeks w obu ramach danych technika scalania jest bardziej elastyczna. Scaluje DF1 i DF2 po dopasowaniu indeksu DF2 do indeksu DF1, wyświetla „NAN” w tym rzędzie DF2 dla tych, których indeksy nie pasują.

Trzy skierowanie można zobaczyć na wynikowym obrazie. Pierwsze dwa dane „DF1” i „DF2”, to te, które stworzyliśmy. Widzimy, że trzeciaFrame DataFrame korzysta z funkcji „dołącz ()” do łączenia górnych i dolnych ram danych na podstawie ich indeksów. Ci, których indeks nie pasował, byli tam pokazani „Nan”.

Wniosek

Rama danych jest łączona przy użyciu techniki pand „Merge ()”. Kolumny z obu ram danych są łączone podczas procesu łączenia znanego jako scalanie. Dołączenie, indeksy lub kombinacja tych dwóch jest również obsługiwane przez scalanie. Ten artykuł obejmował działanie funkcji „łączy ()” i „merge ()” w bibliotece Pandas Python. Możesz łatwo dołączyć do dwóch ram danych, korzystając z ich lokalizacji indeksu przy użyciu wymienionych powyżej metod, a także nauczyłeś się wdrażania procedur łączenia.