„Pandy” to świetny język do przeprowadzania analizy danych ze względu na jego wielki ekosystem pakietów Python zorientowanych na dane. To ułatwia analiza i import obu czynników. „Vlookup” oznacza „wyszukiwanie pionowe”. Służy do scalania dwóch różnych tabel w ramce danych, w których powinny istnieć pewne powszechne atrybuty między nimi (dwie tabele). Jako wyjście otrzymamy pojedynczą tabelę, która składa się z danych z obu wspólnych tabel. Jest to podobne do funkcji jednego wyszukiwania używanej w „Excel”. Wdrożymy wszystkie możliwe metody, w których używany jest pandas vlookup. Do wykonywania kodów użyjemy „Spyder”, które jest oprogramowaniem napisanym w „Python” w przyjaznym języku.
Składnia:
„PD.scal (df1, df2, on = 'nazwa kolumny', jak = 'left')
Dostarczona składnia jest używana do vlookup w pandy. Zrobimy to za pomocą funkcji „scalania” pandy. „DF” w składni jest skrótem „DataFrame”. „PD” to biblioteka Panda i funkcja „kropka” z nią. Wykonuje pracę nad dopasowaniem podobieństw między dwiema kolumnami w ramce danych. Następnie, w nawiasie, możemy zapisać nazwyFrame Data Frame metodą, którą chcemy wykonać. Zrobimy wszystkie metody: „wewnętrzny”, „lewy” i „prawe.
Poniżej znajdują się sposoby wykonania metody vlookup pandas. Zrobimy to z przykładami dla lepszego zrozumienia.
Tworzenie ramki danych dla przykładowej implementacji pandas vlookup
Aby utworzyć ramkę danych, otwórz narzędzie „Spyder”, ponieważ użyjemy go dla przykładów. Najpierw importujemy bibliotekę pandy jako „PD”. DataFrame składa się z „graczy” i „zespołu”. Gracze to „N”, „M”, „O”, „P”, „Q” i „R”. A zespoły mają „jedenaście” i „dwadzieścia”. W ten sposób tworzona jest oprawa danych z podaną instrukcją drukowania.
Wyjście wyświetla utworzoną ramkę danych podaną w następującym kodzie:
Tworzenie kolejnej ramki danych dla przykładowego wykonania Pandas Vlookup
Tutaj utworzymy kolejną ramkę danych, aby możliwe było wykonanie aplikacji. Idziemy krok po kroku, aby istniało jasne zrozumienie pandę vlookup. DataFrame składa się z „graczy” i „punktów”. Gracze to „36”, „85”, „44”, „55”, „35” i „25”. Następnie przekazuje się instrukcja „Drukuj” DataFrame dla tworzenia ramki danych pokazanej na konsoli wyjściowej.
Dane wyjściowe pokazuje kolejną ramę danych utworzoną, że dane wstawione do kodu:
Ponieważ utworzyliśmy dwie oddzielne ramki danych, teraz używamy ich do ImpleTo Implement funkcji vlookup.
Przykład 1: Funkcja VlookUp za pomocą scalania (po lewej stronie)
W tym przypadku wykonamy funkcję vlookup za pomocą połączenia scalania. „DF” składa się z graczy jako „Q”, „W”, „E,„ R ”,„ T ”i„ Y ”oraz zespoły„ siedemnaście ”i„ Osiemnaście ”. DrugaFrame Data -Rrame ma punkty „52”, „18”, „14”, „13”, „12” i „11”. Funkcja VLookUp przegląda wartości w tabelach DataFrame, które kolumna pasuje. Operacja połączenia „lewy” zapewnia wszystkie wiersze z „pierwszej” danych danych i dopasowuje się do „drugiego” sprawdzania, które wiersze nie są dopasowane, aby wartości te zostały zastąpione jako „NAN”.
Nan oznacza „nie wartość”, co oznacza, że nie ma tam żadnej wartości. Jak widzimy, „gracze” jest wspólną kategorią wśród dwóch ram danych. Zatem warunki, które się na nim spełnia, a lewe połączenie jest na miejscu, w którym porusza się ten przykład.
Wyświetlacz pokazuje VlookUp DataFrame w Panandach, gdy gracze podążają odpowiednio z informacjami zespołu i punktami.
Przykład 2: Funkcja Vlookup za pomocą scalania (łącznik wewnętrzny)
Tutaj wykonamy Pandas Vlookup z połączeniem Merge Inner. DataFrame ma graczy „A”, „S”, „D”, „F”, „G” i „H”. Obie strumienie danych mają nazwę tego samego gracza. „DF1” składa się z zespołu jako „dwanaście i„ osiemnaście ”. Podczas gdy „DF2” ma punkty graczy, takie jak „91”, „92”, „93”, „94”, „95” i „96”. Metodą, której używamy w tym przykładzie dla funkcji vlookup, jest połączenie wewnętrzne, które służy do wykonywania wyjścia tylko tych kolumn, w których warunek jest spełniony w obu powstałych kolumnach. Określamy słowo kluczowe „wewnętrzne” dla wydajności w danych danych.
Wyniki pokazują, że wewnętrzne połączenie wykonane podczas widzimy, że funkcja pandas vlookup jest reprezentowana.
Przykład 3: Funkcja Vlookup za pomocą scalania (prawe połączenie)
W przykładzie 1 dokonaliśmy operacji połączenia lewej dla Vlookup w Pandy. Tutaj zrobimy przykład pandas vlookup za pomocą połączenia scalania „prawego”, co jest prawie jednorodne jako „przyłączanie lewicy”. „DF” obejmuje graczy takich jak „Z”, „X”, „C”, „V”, „B i„ K ”w obu ramach danych. „DF1” obejmuje zespoły takie jak „Oval”, „Square” i „Prostokąt”, w których drugi DF ma punkty takie jak „86”, „85”, „84”, „83”, „82” i „81” indywidualnie. Specyfikacja odpowiedniego połączenia powinna dotyczyć obrotu wspornika scalania w kodzie.
Wyświetlacz pokazuje odpowiednią funkcję Data Funkcjonującą funkcję Pandas Vlookup, która jest podobna do operacji łączenia pandy „lewych” wykonywanej w ramce danych dla pandas vLookup.
Przykład 4: Funkcja Vlookup za pomocą scalania (Zewnętrzny połączenie)
Tutaj wykonamy zewnętrzną funkcję łączenia dla pandai vlookup. Rzeka danych składa się z danych jako odtwarzacza zarówno dla „L”, „J”, „U”, „T”, „P” i „M”. „DF1” składa się z zespołu jako „okręgu” i „prędkości”. „DF2” składa się z punktów „77”, „47”, „35”, „90” i „19”. Zewnętrzne połączenie, którego tu używamy, służy do wykorzystania dostarczania wyświetlania ramki danych o obu ramach danych, których wartość pasują, a wartości nie przypisane są wyświetlane jako „nan”.
Wyjście wyświetla zewnętrzną metodę połączenia funkcji pandas vlookup. NAN na wyświetlaczu to nie przypisane wartości.
Wniosek
Pandas Vlookup za pomocą operacji merge () ułatwia wykonywanie funkcji „vlookup” w „stylu vlookup”. Przeprowadziliśmy wszystkie metody, w których można użyć pandę. Zrobiliśmy to za pomocą funkcji scalania „Wewnętrznego połączenia”, „zewnętrznego połączenia”, „połączenia lewego” i metod „prawego łączenia”. Wszystkie metody mają doskonałą wydajność w zależności od sytuacji, w których można użyć pandas vlookup. Pandas Vlookup pojawił się tak wygodnie, jak widzimy „Dane” „Dane”, które są dobrze zarządzane i reprezentowane. Wszystkie dodatkowe kolumny zostały pominięte, pisząc tylko wtedy, gdy są powszechne w ramce danych. Wartości powinny być niepokojące, co sprawia, że każda wydajność analizy dla dalszej oceny danych jest najlepsza i łatwa, jak to tylko możliwe.