Histogramy to diagramy złożone z prostokątów, aby wyświetlić dowolny statystyczny zestaw danych. Są używane do podsumowania graficznego rozkładu informacji statystycznych. Histogramy są bardzo wszechstronne i zapewniają prostotę. Są używane do reprezentowania częstotliwości zmiennej w zakresie ciągłych.
Postaramy się omówić histogram w tym artykule. Najpierw przejdziemy przez składnię Funkcja hist () Przed przyjrzeniem się niektórym przykładom tworzenia histogramów w R za pomocą tej metody.
Histogram w R:
W programowaniu R histogramy są bardzo pomocne w wizualizacji zakresu zdefiniowanego przez użytkownika. Histogram jest jedną z najczęściej używanych wykresów do wyświetlania i analizy danych graficznych. Histogramy są powszechnie przedstawiane jako pionowe prostokąty wyrównane wzdłuż osi dwuwymiarowej, wykazując porównanie grup danych. Liczba danych jest reprezentowana przez rozmiar kolumn lub prostokątne pola na osi y, podczas gdy wartości grup danych są pokazane na osi x. Histogramy pomagają w ocenie danych. W R można wygenerować histogram dla określonej zmiennej. Jest to ważne dla wyboru zmiennego i aplikacji do nauki funkcji w projektach naukowych.
Konstruowanie histogramu w R:
Składnia do budowy histogramu w R wynosi:
# Hist (v, main, xlab, ylab, xlim, ylim, pęknięcia, col, granica)
"v”Reprezentuje dane użyte do utworzenia histogramu. "główny”To tytuł Char,„przełęcz”To kolor barów,„xlab”To etykieta dla osi poziomej i„ylab”Jest etykietą osi pionowej. "xlim”Służy do zdefiniowania limitu osi poziomej. "ylim”Służy do zdefiniowania limitu osi pionowej. "przerwa”Jest wykorzystywany do określenia szerokości pojemników. "granica”Określa kolor granicy baru.
Wykonamy różne przykłady, aby zrozumieć i zaimplementować wszystkie parametry wymienione w powyższym akapicie.
Przykład nr 1: Tworzenie prostego histogramu w R za pomocą wbudowanego zestawu danych lub wektora:
Histogram potrzebuje wbudowanego zestawu danych, aby zaimportować do R do oceny. Liczne moduły i funkcje graficzne są zawarte zarówno w R, jak i jego bibliotekach. W tym przykładzie wykorzystaliśmy wbudowany zestaw danych pasażerów powietrza. Aby skonstruować histogram dla określonego zestawu danych, użyj funkcji Hist () ze znakiem $, aby wybrać określoną kolumnę danych z zestawu danych.
Poniższy przykład tworzy histogram wartości w zestawie danych pasażera powietrza:
Powstały histogram wygląda tak:
W powyższym przykładzie nauczyłeś się tworzyć histogram za pomocą wbudowanego zestawu danych. Ponadto możesz szybko wygenerować histogram za pomocą funkcji „hist ()”, która ocenia histogram w zależności od określonych wartości. Podajesz nazwę swojego zestawu danych między nawiasami tej funkcji. Ta funkcja akceptuje listę liczb do wykreślenia histogramu.
Korzystając z opcji „głównej”, możesz dodać tytuł do histogramu. Przekazując „główne” jako dane wejściowe do metody Hist (), możesz zmienić nazwę histogramu. W tym scenariuszu tworzysz histogram z kolekcji danych „S” o nazwie „All Studenci”. Podczas gdy „XLAB” będzie używane do nazwie osi X.
Możesz zobaczyć histogram wyjściowy Hist () z listą liczb:
Przykład nr 2: Dodanie koloru, granicy i łamów do histogramu:
Domyślne reprezentacje rzadko pomagają analizować swoje histogramy. Musisz wykonać jeszcze jeden ruch, aby uzyskać głębszą wiedzę na temat swoich histogramów. R zapewnia różne szybkie i proste rozwiązania w celu optymalizacji reprezentacji diagramów przy jednoczesnym wykorzystaniu funkcji Hist ().
Argument „Col” zostanie użyty do dodania koloru do histogramu, a następnie wspomnienia o nazwie koloru. Oprócz tego możesz również dodać kolor graniczny do pojemników histogramu za pomocą parametru „granica”. Opcja „Breaks” pozwala nam wybrać liczbę słupków w histogramie. Ta liczba jest jednak tylko zaleceniem. Możemy zdefiniować liczbę słupków w histogramie z parametrem „przerwy”. Możesz podać parametr „przerwy” wektor punktów przerwania, jeśli chcesz dodatkowej kontroli nad punktami przerwania między pojemnikami. Jest to możliwe w przypadku funkcji „C ()”.
Kolorowy histogram wyjściowy:
Przykład nr 3: Zakresy ustawiania osi X i osi Y:
Aby określić zakres wartości, użyj argumentów „xlim” i „ylim”. Zakres dostarczony do tych dwóch argumentów określi osie naszej grafiki histogramu. Rzućmy okiem na to, jak to się robi.
Ten histogram w powyższym fragmencie kodu ma osi x ograniczony do wartości od 0 do 50 i osi y ograniczonej do wartości 0 do 4. Przy użyciu „xlim” i „ylim” stosuje się metodę „c ()”, aby ograniczyć wartości na osiach. Wymaga dwóch wartości: jedna dla początku i jedna na koniec.
Powyższy skrypt tworzy histogram wartości danych z „S” i nazywa go „wszystkich uczniów”, określa oś x jako „nie. uczniów ”, dodaje czarną granicę i niebieski kolor do pojemników, ogranicza oś x od 0 do 50, oś y od 0 do 4 i zmienia szerokość pojemnika na 6.
Przykład nr 4: Histogram z wyklutym wzorem wypełnienia:
Możesz także skonstruować histogram z wyklutym wzorem. W tym przykładzie konstruuje się histogram wypełnienia wylęgającego z liniami pochylnymi 45 °. W histogramie częstotliwość jest określana przez obszar paska, a nie jego wysokość, co odnosi się do jego „gęstości”. Linie wylęgowe będą niebieskie, podczas gdy granice będą czarne.
Kiedy uruchamiamy powyższy kod, otrzymujemy następujący wynik:
Wniosek:
W tym temacie próbowaliśmy zbadać podstawy budowania histogramu w R za pomocą RStudio. Aby użyć argumentów w metodzie „hist ()”, wykonujemy kilka zestawów kodu. W czterech przypadkach omówiliśmy podstawową konstrukcję histogramu, jak dodać kolor i granicę do histogramu, jak ograniczyć zakresy osi x i y oraz jak dodać wylęganie do histogramów. Będziesz w stanie poprawić atrakcyjność histogramu, postępując zgodnie z tymi prostymi i łatwymi przykładami.