Pandy Sprawdź, czy dwie kolumny są równe

Pandy Sprawdź, czy dwie kolumny są równe
Często będziesz chciał porównać dane w dwóch kolumnach w PandaS DataFrame i wyświetlić wyniki w trzeciej kolumnie. Dowiemy się wszystkich wskazówek, jak porównać kolumny w ramce danych Pandy w tym poście. Pandy jest przydatnym pakietem Python do analizy danych, wizualizacji, oczyszczania danych i innych działań. Czytaj dalej ten artykuł, aby znaleźć wszystkie szczegóły dotyczące porównywania dwóch kolumn w ramce danych pandas z przykładami.

Moduł pand w Pythonie

Moduł Python Pandas jest zasadniczo darmowym pakietem Python. Ma szeroki zakres aplikacji w obliczeniach, analizie danych, statystykach i innych dziedzinach.

Moduł Panda wykorzystuje podstawowe funkcje modułu Numpy. Numpy to struktura danych na niskim poziomie. Umożliwia użytkownikom manipulowanie wielowymiarowymi tablicami i stosowanie do nich różnych operacji matematycznych. Pandy oferują bardziej zaawansowany interfejs użytkownika. Obejmuje również solidne możliwości szeregów czasowych i ulepszone dostosowanie danych tabelarycznych.

DataFrame to główna struktura danych Pandas. Jest to struktura danych 2D, która pozwala przechowywać i manipulować danymi w formie tabelarycznej.

Pandy mają wiele funkcji dla DataFrame. Przykłady dostosowania danych, kroje.

Po co porównać dwie kolumny w pandy?

Kiedy chcemy porównać wartości dwóch kolumn lub zobaczyć, jak są podobne, musimy je porównać. Na przykład, jeśli mamy dwie kolumny i chcemy ustalić, czy kolumna jest większa czy mniej niż inna kolumna, czy ich podobieństwo, porównanie kolumn jest odpowiednim sposobem na zrobienie tego.

Aby powiązać wartości w pandy i Numpy, istnieje wiele podejść. W tym artykule redakcyjnym przejdziemy przez liczne strategie i działania związane z wprowadzeniem ich w praktykę.

Załóżmy, że mamy dwie kolumny: kolumna A zawiera różne projekty, a kolumna B ma powiązane nazwy. W kolumnie D mamy kilka niepowiązanych projektów. Na podstawie projektów w kolumnie D chcemy zwrócić powiązane nazwy z kolumny B. W programie Excel, w jaki sposób możesz porównać kolumny A i D i uzyskać względne wartości z kolumny B? Spójrzmy na niektóre przykłady i zrozum, jak to osiągnąć.

Przykład 1:

NP.gdzie () technika zostanie zastosowana w tym przykładzie. Składnia to Numpy.gdzie (warunek [, a, b]). Ta metoda odbiera warunek, a jeśli warunek jest prawdziwy, wartość, którą dostarczamy („A” w składni) będzie wartością, którą im podajemy.

W kodzie importujemy niezbędne biblioteki, pandy i Numpy. Skonstruowaliśmy słownik i wymieniliśmy wartości dla każdej kolumny.

Dostajemy warunek porównywania kolumn za pomocą metody Where () w Numpy. Jeśli „First_Column” jest mniejszy niż „Second_Column”, a „First_Column” jest mniejszy niż „trzeci_kolumn”, są drukowane wartości „First_Column”. Jeśli warunek się nie powiedzie, wartość jest ustawiona na „nan.„Te wyniki są zapisywane w nowej kolumnie DataFrame. Wreszcie, na ekranie jest prezentowana na ekranie.

importować pandy
Importuj Numpy
data =
„First_Column”: [2, 3, 40, 5],
„Second_Column”: [8, 5, 30, 10],
„Trzeci_kolusz”: [4, 9, 12, 40]

d_frame = pandy.DataFrame (dane)
d_frame ['new'] = numpy.gdzie ((d_frame ['First_Column'] <= d_frame['Second_Column']) & (
D_Frame ['First_Column'] <= d_frame['Third_Column']), d_frame['First_Column'], numpy.nan)
Drukuj (d_frame)

Wyjście pokazano poniżej. Tutaj możesz zobaczyć First_Column, Second_Column i Third_Column. Kolumna „Nowa” pokazuje wynikające wartości po wykonaniu polecenia.

Przykład 2:

Ten przykład pokazuje, jak użyć metody equals () do porównania dwóch kolumn i zwrócenia wyniku w trzeciej kolumnie. Ramka danych.równa się (inne) składnię. Ta metoda sprawdza, czy dwie kolumny mają te same elementy.

Używamy tej samej metody w poniższym kodzie, która polega na importowaniu bibliotek i budowaniu ramki danych. W tym DataFrame utworzyliśmy nową kolumnę (o nazwie: Fourth_Column). Ta nowa kolumna równa się „drugiej_koluszowi”, aby pokazać, co funkcja wykonuje w tym ramie danych.

importować pandy
Importuj Numpy
data =
„First_Column”: [2, 3, 40, 5],
„Second_Column”: [8, 5, 30, 10],
„Trzeci_kolusz”: [4, 9, 12, 40],
„Fourth_column”: [8, 5, 30, 10],

d_frame = pandy.DataFrame (dane)
drukuj (d_frame ['Fourth_Column'].równa się (d_frame ['Second_Column'])))

Kiedy uruchamiamy przykładowy kod podany powyżej, zwraca „true”, ponieważ możesz wyświetlić na załączonym obrazie.

Przykład 3:

Ta metoda pozwala nam przejść metodę i w inny sposób warunki w końcowym przykładzie naszego artykułu i mieć tę samą funkcję wykonaną w serii Pandas DataFrame. Korzystając z tej strategii, minimalizujemy czas i kod.

Ten sam kod jest również używany w tym przykładzie do utworzenia ramki danych w pandy. Tworzymy tymczasową funkcję anonimową w Apply () przy użyciu Lambda za pomocą metody Apply (). Określa, czy „kolumna 1” jest mniejsza niż „kolumna2” i „kolumna 1” jest mniejsza niż „kolumna3”. Jeśli prawda, wartość „kolumna 1” zostanie zwrócona. Wyświetli NAN, jeśli jest fałszywy. Nowa kolumna służy do przechowywania tych wartości. W rezultacie porównywano kolumny.

importować pandy
Importuj Numpy
data =
„First_Column”: [2, 3, 40, 5],
„Second_Column”: [8, 5, 30, 10],
„Trzeci_kolusz”: [4, 9, 12, 40],

d_frame = pandy.DataFrame (dane)
d_frame ['new'] = d_frame.Zastosuj (Lambda X: X ['First_Column'] Jeśli x ['First_Column'] <=
x ['second_column'] i x ['first_column']
<= x['Third_Column'] else numpy.nan, axis=1)
Drukuj (d_frame)

Załączony obraz pokazuje porównanie dwóch kolumn.

Wniosek:

To był krótki post na temat korzystania z pandy i Pythona w celu porównania jednej lub więcej kolumn dwóch ramek danych. Przeszliśmy przez funkcję equals () (która sprawdza, czy dwa obiekty pandas mają te same elementy), NP.gdzie () metoda (która zwraca elementy z x lub y w zależności od kryteriów) oraz metodę Applant () (która akceptuje funkcję i stosuje ją do wszystkich wartości w serii pandy). Jeśli nie znasz tej koncepcji, możesz skorzystać z tego przewodnika. Dla Twojej wygody post zawiera wszystkie szczegóły, a także wiele próbek.