Pandy porównują dwa wiersze danych według wiersza

Pandy porównują dwa wiersze danych według wiersza
Rama danych to dwuwymiarowa struktura wykonana z wierszy i kolumn, w których dane są przechowywane w formacie tabelarycznym. Jest elastyczny pod względem długości i różnorodnych danych tabelarycznych. Obliczenia arytmetyczne można wykonać zarówno w wierszu, jak i na etykietach kolumnowych. W radzeniu sobie z panami data.

Pand jako metoda porównywania

W Panand metoda porównywania wyświetla wariancje między dwiema ramkami danych. Ta metoda porównuje dwa ramki danych, wiersz po rzędu i kolumna po kolumnie. Następnie wyświetla różnice obok siebie. Funkcja porównywania może porównać tylko ramki podobnej struktury, z tym samym nazwami wiersza i kolumn oraz równymi rozmiarami.

Postępuje zgodnie z następującą składnią:

Omówmy krótko parametry.

„DF_2” to dowolna ramka danych do porównania. „ALIGN_AXIS” Określa osie porównawcze, z 0 dla wierszy i 1 dla kolumn jako wartości domyślnej. „Keep_shape” Parametr to wartość logiczna. Umieszczenie tego do „prawdziwego” zabrania wyeliminowania dowolnego wiersza lub kolumny. W przypadku wartości domyślnej „Fałsz” porównuje krople kolumny i wierszy posiadające wszystkie atrybuty takie same dla dwóch ramek danych. Kolejny logiczny argument to „Keep_equal”. Dwie ramki danych wyświetlają równe wartości. Gdy jest to ustawione na „true”, wyświetla pozycje dla dwóch ramek danych o identycznych wartościach jak NAN dla domyślnego ustawienia „FALSE”.

Przykład: Wykorzystanie Pandy Porównaj metodę

Wykorzystaliśmy tutaj narzędzie „Spyder”. Otwórz nowy plik Pythona w narzędziu „Spyder”. Musimy „zaimportować pandy jako PD”, aby uzyskać dostęp do funkcji pandas. Niezwykle ważne jest, aby zauważyć, że wydania pandy muszą wynosić 1.1.0 lub wyżej. Następnie utworzyliśmy naszą pierwszą ramkę danych przy użyciu metody pandas „PD.DataFrame () ”i zapisał tę ramkę danych w zmiennej„ First_Table ”.

Zainicjowaliśmy tę ramkę danych z trzema kolumnami „Produkt”, „Cena” i „Ilość”. Każda kolumna przechowuje tę samą długość wartości, która wynosi pięć. Pierwsza kolumna „Produkt” danych „First_table” jest przechowuje pięć wartości, które są „akrylami”, „płótno”, „ołówki”, „notatniki” i „pędzle”. Nasza druga kolumna „Cena” to przechowuje 5 wartości INT, które to „260”, „100”, „25”, „350” i „200”. Ostatnia kolumna tutaj to „ilość”, a także przechowuje wartości INT, które są „1”, „2”, „5”, „3” i „6”. W ostatnim wierszu skryptu zastosowaliśmy funkcję „print ()”, aby wyświetlić naszą pierwszą ramkę danych.

Po naciśnięciu przycisku „Uruchom plik” lub użycie narzędzia „Spyder” narzędzia „Shift+Enter” na klawiaturze, wypełnienie pliku Python wykonuje. Dane wyjściowe wyświetlone na terminalu pokazuje ramkę danych z 3 kolumnami, które zostały pomyślnie utworzone.

Muszą być dwie formy danych, aby je porównać. Utworzyliśmy już naszą pierwszą ramkę danych „First_Table”. Teraz musimy wygenerować drugą ramkę danych. Przed skonstruowaniem drugiej ramki danych musimy pamiętać o niektórych ograniczeniach, o których wspomnieliśmy we wstępie. Obie ramki danych powinny mieć te same nazwy kolumn, dokładne kształty i równą długość. Tylko wtedy możemy zastosować metodę porównania.

W celu wygenerowania drugiej ramki danych skopiowaliśmy pierwszą strukturę „First_Table” z pewnymi zmianami. Utworzyliśmy ramkę danych „Second_Table” i przypisaliśmy ją wyjście wywołania „DataFrame.Metoda kopii () ”. „„.Copy () ”funkcja skopiuje strukturę tabeli„ pierwszej_tabki ”. Chcemy skopiować kształt, ale musimy zmodyfikować niektóre wartości w nowej ramce danych, więc użyjemy „.lokal ”nieruchomość tutaj. Ta właściwość określa lokalizację, w której chcesz dodać wartość. Działa według nowej nazwy „Second_Table” z „z„.loc [0, „cena”] = 300 ”. Zatem w indeksie „0” kolumny „Cena” w ramce danych „Second_Table” umieści wartość „300”.

W lokalizacji indeksu „1” kolumny „Cena” wartość jest umieszczana „120”. Indeks LOC „2” kolumny „Cena” przechowuje wartość „20”. A pozostałe dwie wartości zostałyby skopiowane, podobnie jak z kolumny „First_table” „Cena”. Podobnie w indeksie LOC „0” kolumny „ilości” wartość jest modyfikowana do „2”. LOC „1” kolumny „ilości” ma wartość „3”. LOC „2” kolumny „ilości” ustawiono wartość „6”. Reszta wartości zostanie skopiowana z kolumny „First_table” „Ilość”. Następnie zastosowaliśmy funkcję „print ()”, aby wykazać drugą ramkę danych na terminalu.

Po wyświetleniu wyjścia można zauważyć, że „Second_Table” ma wszystkie te same kolumny co „First_Table”. Zmodyfikowane wartości kolumn „cena” i „ilości” są skutecznie zaimplementowane w dostarczonych lokalizacjach.

Tutaj zaczyna się główne zadanie. Musimy teraz porównać obie strony danych. W tym celu użyjemy pandy „DataFrame.Porównaj () ”metoda.

Wywołaliśmy „DataFrame.Porównaj () ”metoda. Podąża za składnią jako nazwą pierwszej strumienia danych „First_Table” z „.porównaj () ”i między nawiasami„.Porównaj () ”metoda. Podaj nazwę drugiej ramki danych „Second_Table”. Stworzyliśmy zmienne „porównanie” do przechowywania wynikającej z nich wygenerowanej z porównywania „First_Table” i „Second_Table”. Wreszcie, metoda „print ()” jest wywoływana ze zmienną „Porównanie” jako jej parametru, aby wyświetlić wynikową ramkę danych.

Oto wynik danych wyjściowych z porównanie zarówno odrębnych wartości DataFrame. Domyślnie zrzuca te same wartości. Porównanie odbywa się pod względem kolumny według ustawień domyślnych.

Teraz, jeśli chcemy narysować porównanie, musimy zmienić wartość parametru „osi wyrównania”. Jego domyślna wartość to „1”, która narysuje porównanie kolumnowych. Ustawiliśmy „align_axis = 0”, więc wiersze tabeli są rysowane sekwencyjnie od siebie i innych. Następnie nazwaliśmy funkcję „print ()”, aby wyświetlić wynik.

Poniższy obraz wyjściowy pokazuje rysunek danych z porównywaniem wierszowym.

Użyj ".Porównaj argumenty metody „Zachowaj kształt”, aby wyświetlić wszystkie wpisy w tabeli „Porównanie”. Domyślnie „Keep_Shape” jest ustawione na „false”. Jeśli „prawda”, wszystkie wiersze i kolumny są zawarte w tabeli; W przeciwnym razie przechowywane są tylko osoby o różnych wartościach.

Możesz zobaczyć wyjście pokazuje wszystkie kolumny i wiersze, ale te same wartości są tutaj wyświetlane jak „nan”, a odrębne wartości są przechowywane tak, jak są.

Teraz, jeśli chcesz wyświetlić wszystkie wartości bez drukowania jako „NANS”, musisz użyć parametru „Keep_Shape = True”. Jeśli „keep_equal” jest ustawione na „true”, wyjście zawiera również równe wartości. Równe wartości są inaczej wyświetlane jako „NANS”. Domyślne ustawienie tego parametru brzmi: „Fałsz."

Dane wyjściowe wyświetlone na terminalu pokazuje ramkę danych z rysunkiem wyciągniętym wierszem wszystkich wartości dwóch ramek, które utrzymują równe, a także odrębne wartości.

Wniosek

W tym przewodniku omówiliśmy technikę porównawczą pandy, aby porównać dwie struny danych. Wyjaśniliśmy składnię pandy „.Porównaj () ”funkcję i wszystkie jej parametry. Za pomocą narzędzia „Spyder” zaimplementowaliśmy i opracowaliśmy przykładowe kody w Python.