Spiski.wyrazić.histogram

Spiski.wyrazić.histogram
Jedną z najczęstszych działek w analizie statystycznej jest histogram. Jest to jeden z najbardziej wydajnych i łatwych sposobów na wdrożenie rodzaju wykresu, który pokazuje rozkład częstotliwości. Jest bardzo podobny do wykresu barowego z kilkoma głównymi różnicami. Pomyśl o tym jak o zagregowanym wykresie barowym.

W tym samouczku dowiemy się, w jaki sposób możemy utworzyć wykres histogramu za pomocą modułu express.

Spiski.wyrazić.histogram ()

W plotly Express używamy funkcji histogram () do utworzenia wykresów histogramu. Funkcja zapewnia składnię, jak pokazano:

spiski.wyrazić.histogram (data_frame = brak, x = none, y = brak, kolor = none, wzór_hape = brak, facet_row = brak, facet_col = brak, facet_col_wrap = 0, facet_row_spacing = brak, facet_col_spacing = brak Animation_frame = brak, animation_group = brak, kategoria_orders = brak, etykiety = brak, color_discrete_pecence = Brak, color_discrete_map = brak, wzór_shape_pecence = Brak, wzór_shape_map = brak, marginal = none, orek = brak, orientacja = Brak, barmode = 'relatywne', barnorm = brak, histnorm = brak, log_x = false, log_y = false, range_x = brak, range_y = brak, histFunc = brak, kumulatywny = brak, nbins = brak, text_auto = false, tytuł = brak, szablon = brak, szerokie = w szerokim Brak, wysokość = brak)

Poniżej znajdują się najbardziej przydatne parametry funkcji, które musisz wiedzieć:

  1. Data_frame - określa ramkę danych zawierających nazwy kolumn. Możesz przekazać tę wartość jako ramkę danych, słownik lub obiekt podobny do tablicy.
  2. x - Określa wartości używane do ustawiania znaków wzdłuż osi x wzdłuż współrzędnej kartezjańskiej. Może to być nazwa kolumny w ramce danych lub serii pandy.
  3. y - podobne do x, ale wartości określone w tym parametrze są używane do ustawienia znaków wzdłuż osi y.
  4. Kolor - definiuje wartości użyte do przypisania unikalnego koloru do znaków.
  5. Skumulowane - określa, czy wartości histogramu są kumulatywne.
  6. NBINS - Określa liczbę pojemników.
  7. Histnrom - określa tryb, w którym tworzone są pojemniki. Zaakceptowane wartości obejmują:
    1. 'procent'
    2. 'prawdopodobieństwo'
    3. 'gęstość'
    4. 'gęstości prawdopodobieństwa'

Funkcja zwróci następnie wykres histogramu typu Graph_Objects.Postać.

Przykład - za pomocą danych gapminder ()

Możemy utworzyć histogram przy użyciu danych GAPMINDER w fabule. Weźmy przykładowy kod pokazany poniżej:

importować fabuły.Wyraź jako PX
df = px.dane.gapminder ().Zapytanie („Continent ==„ Europe ”)
Ryc. = PX.histogram (df, x = „gdppercap”)
Figa.pokazywać()

W powyższym przykładzie używamy danych gapminder () z Plotly Express. Następnie wykreślamy histogram pokazujący dystrybucję PKB na mieszkańca krajów na kontynencie europejskim.

Po uruchomieniu powyższego kodu powinniśmy zobaczyć histogram, jak pokazano:

Przykład 2 - Korzystanie z danych kategorycznych

Możemy również utworzyć histogram danych kategorycznych, określając parametry x i y.

Weźmy przykładowy kod pokazany poniżej:

importować fabuły.Wyraź jako PX
df = px.dane.gapminder ().Zapytanie („Continent ==„ Europe ”)
Ryc. = PX.histogram (df, x = „kraj”, y = „gpperCap”)
Figa.pokazywać()

W tym przypadku histogram pokaże każdy kraj i sumę wartości PKB na mieszkańca, jak pokazano na poniższym rysunku:

Przykład 3 - Określanie rodzaju normalizacji

Domyślnie spółka utworzy histogram z każdą próbką w każdym pojemniku. Możemy jednak określić tryb, w którym chcemy przedstawić pojemniki za pomocą parametru Histnorm.

Spójrzmy na różne przykłady:

Gęstości prawdopodobieństwa

Ryc. = PX.histogram (df, x = 'gdperCap', histnorm = „gęstość prawdopodobieństwa”)
Figa.pokazywać()

W tym przykładzie tworzymy histogram gęstości prawdopodobieństwa, który jest sumą obszarów baru równych 1.

Powstała liczba jest jak pokazana:

Sprawdź listę parametrów, aby dowiedzieć się różnych typów, które możesz określić.

Przykład 4 - Określ liczbę pojemników

Domyślnie Partner wybierze liczbę pojemników, aby jest porównywalna z liczbą próbek w pojemniku. Możemy jednak określić liczbę pojemników za pomocą parametru NBINS.

Przykładem jest jak pokazano:

Ryc. = PX.histogram (df, x = 'gdperCap', nbins = 50)
Figa.pokazywać()

W powyższym przykładzie określamy liczbę pojemników do 50. Powinno to zwrócić figurę, jak pokazano:

Przykład 5 - Określ parametr koloru

Możemy również określić parametr koloru. To przypisuje unikalny kolor na podstawie określonej nazwy kolumn.

Przykładowy kod jest tak, jak pokazano:

Ryc. = PX.histogram (df, x = „gdppercap”, color = „kraj”)
Figa.pokazywać()

Wynikowy rysunek:

W takim przypadku Partly przypisuje unikalny kolor do każdego kraju na wykresie, jak określono w parametrze koloru.

Przykład 6 - Horyzontal histogram

Plotly pozwala nam również tworzyć horyzontalne histogramy. Spójrz na poniższy kod:

Ryc. = PX.histogram (df, x = „gdppercap”, y = „kraj”, color = „kraj”)
Figa.pokazywać()

W takim przypadku wykreśamy histogram suma PKB na mieszkańca każdego kraju. Kod powyżej powinien zwrócić liczbę, jak pokazano:

Przykład 7 - sortowanie według zamówienia kategorii

W niektórych przypadkach możemy chcieć sortować wynikowy wykres na podstawie określonej wartości. Na przykład w powyższym histogramie możemy sortować histogram na podstawie całkowitego guppercap w kolejności rosnącej.

Korzystając z funkcji aktualizacji_xaxes lub aktualizacji_yaxes, określamy, w jaki sposób chcemy sortować dane.

W naszym przykładzie chcemy sortować oś y. Stąd użyjemy funkcji aktualizacji_yaxes (). W funkcji możemy określić parametr i metodę kategorii, w której chcemy sortować dane. W takim przypadku „całkowite zejście”.

Możemy uruchomić kod, jak pokazano:

Ryc. = PX.histogram (df, x = „gdppercap”, y = „kraj”, color = „kraj”).aktualizacja_yaxes (kategoriaRORD = „Total Descing”)
Figa.pokazywać()

Powyższy kod powinien przynieść rysunek, jak pokazano:

Wniosek

W tym artykule zbadaliśmy, jak korzystać z funkcji histogram () z modułu Plotly Express. Funkcja pozwala nam tworzyć histogramy różnych danych.