W dziedzinie statystyki rozkład dwumianowy jest rodzajem rozkładu prawdopodobieństwa. W modelu rozkładu dwumianowego każda próba może mieć tylko jedno wyjście. To samo prawdopodobieństwo sukcesu musi być takie same dla każdej próby, a wiele prób nie może wystąpić lub nie powinny mieć wpływu na wyjście.
W wielokrotnym eksperymencie lub ankiecie rozkład dwumianowy można uznać za prawdopodobieństwo przejścia lub awarii zdarzenia. Rozkład dwumianowy daje wynik tylko na dwa możliwe sposoby lub wartości (prefiks „BI” oznacza „dwa” lub „dwa razy”). Na przykład, gdy odwracamy monetę, ma ona tylko dwa wyniki: głowy lub ogony, a prowadzenie testu ma tylko dwa wyniki: sukces lub porażka.
Dlaczego warto używać rozkładu dwumianowego:
Model dystrybucji prawdopodobieństwa można wykorzystać do odpowiedzi na różne złożone wyzwania biznesowe. Modele te zawierają odpowiedzi na pytania takie jak „Jak prawdopodobne są wzrost cen przedmiotów w ciągu następnego roku?„Rozkłady dwumianowe i poissona dyskretnych zmiennych losowych są dwoma z najczęściej wykorzystywanych rozkładów prawdopodobieństwa w biznesie (możliwa jest tylko skończona liczba wartości). Rozkład dwumianowy oblicza prawdopodobieństwo wystąpień z tylko dwoma możliwymi wynikami (sukces lub porażka), takie jak codzienne patrzenie na cenę zamknięcia akcji na rok i sprawdzenie, czy wspinała się, czy zmniejszyła się.
Co to jest rozkład dwumianowy w R:
Rozkład dwumianowy jest używany w języku programowania R do rozwiązania lub odpowiedzi na problemy statystyczne. Jest to klasyfikacja rozkładu prawdopodobieństwa. Istnieją cztery zdefiniowane funkcje rozkładu dwumianowego w R, I.mi. dbinom, pbinom, qbinom i rbinom. Będąc dyskretnym modelem dystrybucji, sukces lub porażka to jedyne dwa możliwe wyniki, które mogą być wygenerowane przez model rozkładu dwumianowego. Wszystkie próby są niezależne, prawdopodobieństwo sukcesu pozostaje stałe, a poprzedni wynik nie wpłynie na następny wynik lub wynik. Wyniki różnych prób nie są związane. Rozkład dwumianowy pozwala nam obliczyć indywidualne i skumulowane prawdopodobieństwa w danym zakresie.
Jak używać rozkładu dwumianowego w R:
Aby użyć modelu rozkładu dwumianowego w R, istnieją cztery zdefiniowane funkcje wbudowane (dbinom, pbinom, qbinom, rbinom). Poniżej znajduje się składnia dla tych funkcji:
Podczas gdy wektor wartości p reprezentuje wektor prawdopodobieństwa, n zawiera częstotliwość obserwacji, wielkość opisuje liczbę prób, a Probi wskazuje na prawdopodobieństwo lub prawdopodobieństwo zakończenia próby. W poniższych przykładach nauczymy Cię, jak korzystać z tych funkcji wbudowanych w R.
Przykład nr 1: Funkcja Dbinom w R
Dbinom jest znany jako funkcja gęstości dwumianowej w R. Służy do znalezienia gęstości rozkładu dwumianowego. Aby utworzyć wykres R funkcji Dbinom, utworzymy wektor (x_dbniom) zawierający wartości. Ten wektor zostanie zasilany jako wejście w funkcji DBinom.
Po utworzeniu wektora zastosujemy funkcję dbinom do wektora, który utworzyliśmy powyżej. Przypisamy tę funkcję do nowej zmiennej, i.mi. (y_dbinom). Ustawimy rozmiar równy stu, co reprezentuje całkowitą liczbę prób. Dla każdego losowania dwumianowego określamy prawdopodobieństwo na 0.5. Parametry te można modyfikować odpowiadające wymaganiom.
Aby wizualizować wyniki funkcji Dbinom, użyjemy funkcji wykresu, w której przekazamy zmienną zawierającą wyniki funkcji Dbinom. Wynik jest przedstawiony na zrzucie ekranu.
Ten wykres pokazuje wyniki prawdopodobieństwa dla 100 prób.
Przykład nr 2: funkcja pbinom w r
Aby obliczyć skumulowane prawdopodobieństwo zdarzenia, stosuje się funkcję pbinom. Aby utworzyć wykres R funkcji PBINOM, utworzymy wektor o nazwie Wartości zawierającego x_pbinom. Miniemy ten wektor jako argument w funkcji PBINOM.
Teraz przypiszmy funkcję pbinom () do nowej zmiennej (y_pbinom). Określimy te same wartości, jak użyliśmy w przykładzie nr 1 (rozmiar = 100, prob = 0.5).
Przekażemy zmienną Y-Pbinom w funkcji wykresu, aby wizualizować ją na wykresie. Wynik jest przedstawiony na zrzucie ekranu.
Prawdopodobieństwa pierwszych 40 prób wynosi 0.0, ale potem stopniowo rosną do 60 prób, co daje wyjście stałej 1.0 dla wszystkich prób po 60.
Przykład nr 3: Funkcja QBinom w R
QBinom jest znany jako dwumianowa funkcja kwantylowa w R. Służy do obliczenia odwrotnego skumulowanego prawdopodobieństwa zdarzenia. Aby utworzyć wykres R funkcji QBinom, w pierwszym kroku utworzymy wektor (x_qbniom) zawierający niektóre wartości. Ten wektor zostanie podawany jako dane wejściowe do funkcji QBinom.
Obecnie stosujemy funkcję QBinom, aby znaleźć wartości dwumianowej funkcji kwantycznej.
Użyjemy funkcji wykresu, aby pokazać wyniki wykresu. Wynik jest przedstawiony na zrzucie ekranu.
Przykład nr 4: Funkcja RBinom w R
Funkcja RBINOM jest używana w R do generowania liczby losowej z rozkładem dwumianowym. W celu odtwarzalności musimy ustawić wartość nasion i określić wielkość próbki liczby, którą należy narysować.
Teraz możemy użyć funkcji RBINOM do generowania wartości losowych i przypisania ich do nowej zmiennej, którą później użyjemy w funkcji Hist ().
Jak widać, daje nam losowe liczby, a ich zakres wynosi od 0 do 100.
Użyjemy powyższej funkcji Hist (), aby zilustrować wynik histogramu. Wynik jest przedstawiony na zrzucie ekranu.
Wniosek
Po omówieniu tego samouczka powinieneś lepiej zrozumieć rozkład dwumianowy. Będziesz znany z rodzajami rozkładu dwumianowego. Może to być przydatne w różnych złożoności biznesowych, a także w przyszłych badaniach statystycznych. W tym samouczku omówiliśmy rozkład dwumianowy, jego typy i sposób, w jaki można je użyć w R. Wdrożyliśmy różne przykłady, aby ułatwić wszystkim czytelnikom lepiej to zrozumieć.