Regresja liniowa w R

Regresja liniowa w R
Jedną z najczęściej stosowanych metod analizy danych jest regresja. Uczenie maszynowe rozwija się, a wraz z nim przychodzi dobrze znany algorytm: regresja liniowa. W tym artykule zapozna się z tym, jak korzystać z funkcji regresji liniowej R. Modele regresji pasują do obserwowalnych danych do interpretacji powiązań ze zmiennymi. Możesz użyć techniki, aby określić, jak zmienna zmienna zależna jako zmienne niezależne.

Eksploracja regresji jest popularną techniką statystyczną do ustanowienia modelu związku między dwiema zmiennymi. Jedna z tych zmiennych jest określana jako zmienna predykcyjna, a jej wartość jest określana na podstawie badań. Zmienna odpowiedzi jest drugą zmienną, a zmienna predykcyjna pozwala jej uzyskać wartość.

Jaka jest regresja liniowa w języku programowania R w Ubuntu 20.04?

Dwie zmienne są połączone równaniem w regresji liniowej, gdzie moc wykładnicza obu zmiennych wynosi jedna. Po przedstawianiu jako wykres, połączenie liniowe wskazuje prostą linię matematyki. Krzywa jest tworzona przez nieliniowe połączenie, w którym wartość wykładnicza dowolnej zmiennej nie jest równoważna jednej.

Składnia regresji liniowej w równaniu matematycznym:
Regresja liniowa ma późniejsze wszechstronne równanie matematyczne:

y = ax+b

Składnia regresji liniowej w języku programowania R:
W R podstawowa składnia do przeprowadzania analizy regresji jest następująca:

LM (y ~ x)

Gdzie y jest elementem zawierającym zmienną do przewidywania, która jest zależna, a x jest wzorem modelu matematycznego. Polecenie LM () zwraca współczynniki X, ale nie ma innych danych statystycznych. Możemy użyć funkcji LM () do utworzenia modelu relacji między predyktorem i zmienną odpowiedzi.

Jak regresja liniowa jest stosowana w R w Ubuntu 20.04

Poniżej znajdują się cztery kroki do nawiązania związku:

  • Korzystając z metod LM () w R, zbuduj model relacji.
  • Zbierz współczynniki najpierw z konstruowanego modelu i użyj ich do utworzenia równania matematycznego.
  • Aby dowiedzieć się średniej niedokładności prognozy, uzyskaj podsumowanie modelu relacji znanego również jako resztki.
  • Użyj funkcji PRECICT () w R, aby przewidzieć nową wartość dla przecięcia X.

Przykład nr 1: Uzyskaj współczynniki regresji, tworząc model relacji

Tutaj stworzyliśmy prosty model relacji dwóch zmiennych, aby wykonać regresję za pomocą funkcji LM (). To daje nam współczynniki modelu relacji. Pokazajmy to za pomocą następującego skryptu:

Jak pokazano w poprzednim przykładzie, zadeklarowaliśmy zmienną „a”, która jest inicjowana z pewną liczbą losową jako reprezentacja wektorów. Następnie stworzyliśmy inną zmienną, do której przypisaliśmy również do gromadzenia liczb losowych. Funkcja LM () jest wywoływana wewnątrz nowej relacji zmiennej. Do tej funkcji LM () przekazaliśmy zmienne „A” i „B”, aby wygenerować relacje między nimi. Do funkcji drukowania zmienna relacji jest przekazywana, aby pokazać wyjście.

Po wykonywaniu poprzedniego kodu regresji pokazuje regresję wyników współczynnika zmiennej „A”.

Przykład nr 2: Uzyskaj podsumowanie relacji

Metodę podsumowania () w R można zastosować do wyświetlania wyników modelu. Ta funkcja tworzy tabelę z najważniejszymi wejściami z modelu liniowego.

Tutaj stworzyliśmy zmienną „A”, do której przypisaliśmy zbiór niektórych liczb. Istnieje inna zmienna „B”, która ma również pewną liczbę losową. Zmienne te są teraz wywoływane wewnątrz funkcji LM (), która jest przechowywana w relacji zmiennej. Tutaj zmienna „B” jest zmienną zależną, którą należy przewidzieć. W funkcji drukowania mamy funkcję podsumowującą dla relacji regresji. Przeszliśmy zmienną relacji w funkcji podsumowania jako wejście.

Ta tabela wyjściowa podsumowuje wzór, który wygenerował wyniki („wywołanie”) i opisuje resztki modelu („resztki”), które reprezentują sposób, w jaki cały model pasuje do rzeczywistych danych. Następny jest stół „współczynników”. Pierwszy rząd pokazuje szacunki przecięcia Y, podczas gdy drugi rząd pokazuje współczynnik regresji modelu.

Przykład nr 3: Korzystanie z funkcji prognozowania dla nowych wartości

Używamy funkcji przewidywania w regresji liniowej dla nowych wartości. Ta funkcja przenosi dwa parametry do obiektu i nowo utworzone dane, które są wektorem. Formuła, która została już wyprodukowana z funkcją LM (), nazywana jest obiektem. Nowe dane wektorowe zawierają nową wartość dla zmiennej predyktora.

Jak odzwierciedlono w poprzednim obrazie, najpierw stworzyliśmy dwa wektory, „V1” i „V2”. Następnie nazwaliśmy te wektory w funkcji LM (). Wektor „V1” jest przewidywaną zmienną, a „V2” jest zmienną odpowiedzi. Następnie, z nową zmienną „x”, znajdujemy nową wartość z „v1” równa się 150. Funkcja przewidywania przyjmuje obiekt „x” i wyniki funkcji LM ().

Po wykonaniu poprzedniego skryptu R generuje następujące wyniki:

Przykład nr 4: Wykonanie wykresu regresji liniowej

Możemy również stworzyć wykres regresji wkładki w R. Wizualizowaliśmy wykres regresji liniowej z następującego skryptu:

Stworzyliśmy zmienną predyktora i odpowiedzi jako „x” i „y”. Następnie nazwaliśmy je w funkcji LM (). Plik PNG wykresowy jest tworzony tam, gdzie wizualizuje się wykres. Następnie zaprojektowaliśmy nasz wykres regresji liniowej z pewnymi wejściami w funkcji wykresu.

Możesz zobaczyć wykres regresji liniowej w następujący sposób:

Wniosek

Artykuł liniowy w R kończy się tutaj. Regresja liniowa jest bardzo rozległym tematem, ale przedstawiliśmy wszystkie możliwe wyjaśnienia, które są wymagane dla tego tematu. Związek między dwiema zmiennymi można oszacować za pomocą regresji liniowej. Tutaj omówiliśmy kilka przykładów regresji liniowej. Mamy funkcję LM () zastosowaną w regresji liniowej. Następnie zrozumieliśmy funkcję podsumowania regresji liniowej. Funkcja przewidywania jest również wykazana, a także reprezentowaliśmy regresję liniową graficznie.