Numpy Corrcoef

Numpy Corrcoef

„Pakiet Numpy z Python oferuje funkcję o nazwie„ Corrcoef ”; Ta funkcja jest używana ilekroć musimy obliczyć współczynniki korelacji dla „-produktu Pearsona”. Współczynniki korelacji, które obliczyliśmy dla produktu Pearsona-mówi o zakresie korelacji między dwiema zmiennymi. Te współczynniki korelacji są często obliczane, gdy dwa wykresy są wykreślane na rozproszonym wykresie, i oczekujemy, że zależność między tymi zmiennymi jest bardziej pochylona w stosunku do relacji liniowej, więc przy użyciu współczynnika korelacji szacujemy liniowe przynależność między zmiennymi i Te współczynniki korelacji są reprezentowane jako „R”.

Numpy jest znany jako najbardziej rozpoznawalna biblioteka z Pythona, a wszystkie operacje (matematyczne i algebraiczne) można zastosować na nd-arrays za pomocą funkcji, które oferuje ten pakiet biblioteki."

Procedura

Ten artykuł pokaże metodę oszacowania korelacji między dwiema zmiennymi za pomocą funkcji Numpy Corrcoef (). Nauczymy się metodę napisania programu w skrypcie Python dla tej funkcji, praktycznie uruchamiając program na kompilator Python dla różnych przykładów.

Składnia

Funkcje przyjmą zmienne lub tablice, a korelacje między tymi tablicami zostaną następnie obliczone przez funkcję i zostaną zwrócone jako wyjście funkcji.

Numpy. corrcoef (x, y = none, rowvar = true, stronniczość =, ddof =, dtype)


„X” i „y” to tablice, które musimy określić, aby obliczyć współczynniki korelacji zmiennej. „Row var” jest parametrem opcjonalnym; Jeśli jego wartość jest ustawiona na true, co jest również jego wartością domyślną, wówczas funkcja uważa, że ​​każdy wiersz jest zmienną inaczej dla przypadku fałszu, każda kolumna reprezentuje zmienną. „Dtype” to typ danych, który domyślnie jest „pływakiem” dla wyjścia, a reszta dwa parametry „stronniczość” i „ddof” są opcjonalne lub nie są brane pod uwagę, więc nie zawracamy sobie głowy używaniem.

Wartość zwracana

Wartość zwracana dla metody Numpy CorrcoEF () będzie współczynnikami korelacji, które ujawnią korelację między zmiennymi.

Przykład nr 01

Kiedy pracujemy nad statystykami i naukami danych, wiemy, że te dwa pola są bardziej zaniepokojeni znajomością związku między zmiennymi w zestawie danych. Każdy punkt danych w zestawie danych jest obserwacją, a właściwości każdej obserwacji są reprezentowane jako funkcja, a te cechy są zmiennymi zestawu danych. I niezależnie od zestawu danych, których używamy, oferuje funkcję lub zmienne i obserwacje.

Aby zrozumieć korelację między funkcjami, pomyśl o przykładach „jak na dokładność strzelania do koszykówki do celu od gracza wpływa wysokość gracza”. Nauczyliśmy się teraz, czym dokładnie jest ta funkcja i jak bardzo ważne jest, aby wiedzieć o ich korelacji. Dzięki temu zbadajmy tę funkcję corrcoef (), wdrażając ją w nd-arrays, aby znaleźć korelację między cechami tablic. Oprogramowanie, których będziemy używać do wdrożenia przykładu, to „Spyder”, który zainstalował w nim pakiety biblioteczne.

Zaczniemy od napisania programu i zaimportujemy moduł Numpy z biblioteki Numpy; Jest to obowiązkowe do pracy z nd-arrays. Przejdziemy do następnego kroku i utworzymy dwie tablice (jednowymiarowe), wywołując „NP. metoda array () ”i nazwie tablice odpowiednio„ arr_1 ”i„ arr_2 ”. Możemy zainicjować tablice z losowymi elementami, więc na przykład określamy je jako „[3, 6, 9]” dla ARR_1 i „[4, 7, 8]” dla ARR_2. Teraz chcemy wiedzieć o korelacji między tymi dwiema tablicami, więc przekazamy te tablice do argumentu wejściowego funkcji „NP. corrcoef (arr_1, arr_2) ”, a następnie wyświetl wyniki z tej funkcji. Kod tego przykładu jest przepisany w języku programowania „Python” w następujący sposób:



Funkcja zwróciła armat 2D współczynników korelacji posiadających domyślny typ danych „Float”. Dzięki tym współczynnikom korelacji możemy teraz oszacować liniowość w relacji między dwiema lub nawet więcej niż dwiema zmiennymi. W tym przykładzie, jeśli zaobserwujemy macierz 2D, górne wartości przekątne wynoszą „1”, ponieważ wartości te są korelacją między ar_1 i arr_1 i ar_2 z arr_2, podczas gdy wartości dolne i górne są prawe są wartościami prawymi prawymi korelacja między ARR_1 i ARR_2 i są one takie same i mają wartość „0.96 ”, a to reprezentuje współczynniki korelacji Pearsona.

Przykład nr 02

Ten przykład przyjmie corrcoef () dla macierzy 2-wymiarowych, a my zdefiniujemy te dwie tablice metodą „NP. tablica () ”. Elementy obu tych tablic będą wynosić odpowiednio „([3, 6, 9], [4, 7, 8])” i „([6, 3, 8], [2, 5, 12])”. Nazwimy te dwa listy 2D „Arr_1” i „Arr_2”, a następnie przekazamy te tablice do metody Numpy CorrcoEF () i zapiszymy wyniki z tej funkcji i wyświetli je za pomocą metody print (). Kod tego przykładu pokazano na poniższym rysunku. Skopiujemy ten kod i sprawisz, że uruchomi się na kompilatorze „Spyder”.



Wyjście wyświetliło czterowymiarową tablicę o współczynnikach korelacji jako elementów z pływakiem typu danych. Te współczynniki reprezentują związek między dwwymiarowymi tablicami, które zadeklarowaliśmy w przykładzie. Z artykułu zauważ, że górna przekątna ma tę samą wartość 1, co pokazuje, że są współczynnikami korelacji dla tych samych zmiennych, a wartości w innych miejscach są różne; Jest tak, ponieważ wartości te pokazują korelację między różnymi zmiennymi.

Wniosek

Niniejszy przewodnik obejmuje funkcję współczynnika korelacji dla „Momentu produktu Pearson”. W artykule zademonstrowaliśmy, w jaki sposób możemy zastosować tę funkcję w tablicach jednowymiarowych i wielowymiarowych i w jakiej formie funkcja zwróci dane wyjściowe dla nd-arrays. Ponadto przeanalizowaliśmy wyniki z funkcji dla dwóch różnych przykładów.