Cel ustawiony.Funkcja seed () ma zapewnić, że wyniki randomizacji są spójne. Z powodu randomizacji, kiedy losowo wybieramy pewne obserwacje dla dowolnego działania w R lub oprogramowaniu statystycznym, otrzymujemy różne wartości za każdym razem. Jeśli chcemy utrzymać wartości wygenerowane przez początkowe losowe wybór, po randomizacji, możemy albo zachować wyniki w obiekcie lub zmienić mechanizm randomizacji, aby zawsze uzyskiwać te same wyniki."
Jaki jest zestaw.zadanie seed () w R w Ubuntu 20.04?
Najpierw musisz ustanowić ziarno, zanim będziesz mógł użyć R do zainicjowania generatora liczb pseudorandom. Możliwość generowania liczb całkowitych pseudorandomowych, które replikują atrybuty niezależnych pokoleń równomiernie rozmieszczone w przedziale (0, 1) jest wymagana przez większość narzędzi symulacyjnych w statystykach (0,1). Algorytm rekurencyjny o nazwie Generator liczb losowych (RNG) jest wymagany do wygenerowania tych sekwencji liczb pseudorandomowych:
xi = f (xi - 1, xi - 2,…, xi -k)Gdzie (x0, x1,2,…, xk-1) jest nasieniem lub stanem początkowym generatora, a k jest zamówieniem generatora. Funkcja rngkind lub typ parametru zestawu.Funkcja nasion w R, która domyślnie wykorzystuje generator mersenne-twinter, może być używany do wyboru z różnych generatorów. Składnia, której używamy dla zestawu.Funkcja nasienna w języku r jest pokazana w następujący sposób:
Składnia:
ustawić.ziarno (n)Gdzie n jest oznaczone jako liczba całkowita, która służy jako ziarno, wybrana wartość nasion (n) zostanie wykorzystana jako punkt początkowy do generowania serii liczb losowych. W rezultacie, przy tym samym numerze nasion, otrzymasz te same wyniki.
Jak zrobić zestaw.Funkcja nasion działająca w R w Ubuntu 20.04?
Spójrzmy na przykład, jak używać zestawu R.metoda seed () w celu wygenerowania spójnej próbki liczb losowych. Zestaw ramki danych.Metoda seed () jest również pokazana jako przykład.
Przykład nr 1: Korzystanie z zestawu.Funkcja nasion dla losowych wartości w R w Ubuntu 20.04
Kiedy używasz zestawu numerów pseudorandom.Funkcja nasion, otrzymasz inny wynik za każdym razem, gdy je uruchamiasz.
Po pierwsze, pokazaliśmy losowe liczby wygenerowane bez zestawu.funkcja nasion. R ma wbudowaną funkcję o nazwie RNorm, która tworzy wektor odpowiednio rozłożonych liczb losowych. Wewnątrz funkcji RNorm przekazaliśmy wartość numeryczną 3, która po wykonaniu pokazuje trzy losowe wartości. Jeśli jednak ponownie uruchomisz poprzedni kod, wynik jest odrębny. Ponieważ nie znasz nasiona R używanego do konstruowania tej sekwencji, oznacza to, że kod nie jest powtarzalny.
Teraz określiliśmy zestaw.Funkcja sedna i ustaw wartość w niej. Bieżący stan generatora liczb losowych jest zapisywany w zmiennej x, gdzie losowy.Nasiona jest wykorzystywane. To wektor liczb całkowitych, którego długość jest określana przez generator. Następnie nazwaliśmy RNorm z wartością w niej. Wygenerowaliśmy nasiona dwukrotnie, ale z losowym.nasionko. Więc generuje różne losowe wartości zarówno czas. Ponadto dopasowaliśmy zarówno x, jak i.
Możemy przekazać dowolną wartość liczbową do zestawu.funkcja nasion. Generuje wartości losowe, jak na powyższym ekranie montum r. Przeszliśmy wyższe wartości w tej funkcji i otrzymaliśmy losowe wartości.
Przykład nr 2: Korzystanie z zestawu.Funkcja nasion dla losowej ramki danych próbki w R w Ubuntu 20.04
Spójrzmy na przykład zestawu ramki danych.Funkcja seed () wyodrębnia losowa próbka ramki danych.
Wywołaliśmy zestaw.funkcja nasion, w której wartość 1234 jest przekazywana. Następnie utworzyliśmy zmienną reprezentowaną jako indeks, w którym funkcja przykładowa przyjmuje ramkę danych MTCARS i wartość 10. Wygenerował tylko pierwsze dziesięć wpisów na wyjściu.
Zatem losowy zestaw danych próbki jest generowany za pomocą zestawu.funkcja nasion.
Przykład nr 3: Korzystanie z zestawu.Funkcja nasion do obliczania mediany w R w Ubuntu 20.04
Ustawienie ziarna w R jest korzystne w badaniach symulacyjnych, jak wcześniej powiedzieliśmy. Załóżmy, że chcesz znaleźć średnią zestawu liczb wyciągniętych z jednorodnego rozkładu, jak pokazano poniżej.
Powyżej określiliśmy zestaw.Funkcja nasion z liczbą całkowitą wejściową. Następnie utworzyliśmy zmienną N_REP i przypisaliśmy ją wartość do powtórzenia. Istnieje inna zmienna, n, i ustawiona z wartością dla liczby punktów. Funkcja numeryczna jest stosowana do zmiennej N_REP, a następnie mamy iterację nad numerem powtórzeń dla wartości mediany.
Jeśli uruchomisz poprzedni kod, otrzymasz następujące dane wyjściowe:
Przykład nr 4: Korzystanie z zestawu.Funkcja nasion, aby go rozwinąć w R w Ubuntu 20.04
Wreszcie, możesz użyć R do zresetowania lub zabezpieczenia nasion. Masz dwie strategie, aby to zdobyć.
Ponieważ R wykorzystuje zegar systemowy do generowania nasion, gdy nie jest dostarczany, możesz powrócić do domyślnego zachowania, używając SYS.podejście czasowe. Z drugiej strony możesz przekazać wartość null wewnątrz zestawu.funkcja nasion, aby zresetować nasiona.
Wniosek
Możemy użyć losowego ziarna w R, aby upewnić się, że wynik naszej funkcji R jest powtarzalny. Określając ziarno, losowe operacje w naszym programie zawsze zaczynają się w tym samym momencie, a w rezultacie wytwarzaj ten sam wynik. Omówiliśmy zestaw.Funkcja nasion w naszym przykładzie dla różnych przypadków. Wszystkie przykłady są wykonywane w terminalu Ubuntu i mają prawidłowe wyniki.