Scipy Crosstab

Scipy Crosstab

Język programowania Python oferuje różnorodne niesamowite biblioteki, które zapewniają długą listę przydatnych funkcji. Korzystając z tych bibliotek i funkcji, każdą praktyczną aplikacją można łatwo zarządzać. W tym artykule wyjaśnimy funkcję Crosstab dostępną w bibliotece Scipy. Biblioteka Scipy jest jedną z najczęściej używanych bibliotek języka programowania Python, ponieważ zapewnia funkcje dla wszystkich rodzajów operacji statystycznych i matematycznych. Crosstab to kolejna funkcja biblioteki Scipy, w której omówimy w tym przewodniku. Zacznijmy!

Co to jest Crosstab?

Crosstab oznacza tabelę krzyżową, która służy do utworzenia tabeli awaryjnej dwóch lub więcej czynników, zliczając częstotliwości odpowiednich par. Krótko mówiąc, zwraca tabelę zawierającą liczbę każdej unikalnej kombinacji elementów w dwóch lub więcej zestawach danych. Można go wykorzystać do przeprowadzenia potężnej analizy danych poprzez budowanie tabeli podsumowującej.

W tym artykule zademonstrujemy kilka przykładów, aby pokazać, jak korzystać z funkcji Crosstab w programie Python. Dzięki tym przykładom będziesz w stanie lepiej zrozumieć tę funkcję i będziesz mógł ją wdrożyć w swoich programach. Przed przejściem do sekcji przykładów, zrozummy składnię funkcji Crosstab.

Jaka jest składnia funkcji Crosstab?

Funkcja Crosstab jest dostarczana przez bibliotekę Scipy w pakiecie statystyk i klasy awaryjnej. Składnia funkcji Crosstab jest następująca:


Zestawy danych parametrów* reprezentuje sekwencję zestawów danych, których tabelacja krzyżowa ma zostać obliczona. Rozmiar lub elementy powinny pasować do wszystkich zestawów danych. Poziomy i rzadkie parametry są opcjonalnymi parametrami. Jeśli nie zostaną dostarczone, ich wartość domyślna zostanie użyta. Argument poziomów zawiera listę elementów, które mają być policzone w zestawach danych. Liczba „poziomów” i liczba zestawów danych powinny być tak samo.

Wartości podane w parametrze poziomu są liczone w zestawach danych. Jeśli jakiekolwiek odpowiednie wartości nie istnieją w zestawie danych, zostaną zignorowane, a ich liczba nie zostanie zwrócona w wynikającym z tego tablicy. Parametr SPARES zawiera wartość prawdziwą lub fałszywą, wskazując, czy zwrócić rzadką matrycę, czy nie. Domyślnie jest to fałszywe.

Funkcja Crosstab zwraca dwa elementy - jeden to krotka długości, a druga liczba. „Krotek długości” zawiera sekwencję liczanych elementów. Element „liczby” zawiera liczbę każdej pary awaryjnej, która jest również znana jako tabela awaryjna. Teraz, gdy nauczyliśmy się składni funkcji Crosstab, zobaczmy kilka przykładów, aby zrozumieć, w jaki sposób funkcję Crosstab można zaimplementować w programie Python.

Przykład 1:

Zacznijmy od prostego przykładu, abyśmy nie mieli problemu w zrozumieniu podstawowego działania funkcji Crosstab. Rozważ przykładowy kod w następującym fragmencie kodu:

od Scipy.statystyki.import awaryjny Crosstab
a = [„a”, „a”, „a”, „b”, „b”, „b”, „a”, „a”, „a”, „b”, „b”, „b” ]
x = ['x', „y”, „z”, „x”, „y”, „z”, „x”, „y”, „z”, „x”, „y”, „z” ]
(Avals, XVals), Count = Crosstab (A, X)
Drukuj („tablica 1 zawiera:”, Avals)
print ('\ Narray 2 zawiera:', XVals)
print („\ n liczba crosstab to: \ n ', liczba)


Po pierwsze, biblioteka Scipy wraz z pakietem statystyk i klasą awaryjną jest importowana do programu, aby wywołać funkcję Crosstab. Następnie zapewniane są dwie tablice o tej samej długości. Oba są przekazywane do funkcji Crosstab. Deklarowane są trzy zmienne, każda z nich ma unikalny wynik z funkcji Crosstab. Teraz zobaczmy wynik funkcji Crosstab w następujący sposób:


Pierwsza tablica zawiera 2 unikalne elementy - a i b. Podczas gdy druga tablica zawiera trzy unikalne elementy - X, Y i Z. Liczba awaryjna wynosi [[2, 2, 2] [2, 2, 2]], co oznacza, że ​​para (a, x) występuje dwukrotnie, para (a, y) występuje dwukrotnie, para (a, z. ) występuje dwa razy, para (B, x) występuje dwa razy, para (B, Y) występuje dwukrotnie, a para (B, z) występuje dwa razy.

Przykład 2:

Jak omówiliśmy w poprzednim przykładzie, Crosstab akceptuje tyle zestawów danych, ile możesz dostarczyć. Oblicza tabelę awaryjną dla wszystkich zestawów danych. W poprzednim przykładzie dostarczyliśmy tylko 2 zestawy danych. Dodajmy jeszcze jeden i zobacz wynik funkcji Crosstab. Rozważ następujący przykładowy kod:

od Scipy.statystyki.import awaryjny Crosstab
a = [„a”, „a”, „a”, „b”, „b”, „b”, „a”, „a”, „a”, „b”, „b”, „b” ]
x = ['x', „y”, „z”, „x”, „y”, „z”, „x”, „y”, „z”, „x”, „y”, „z” ]
p = [0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1]
(Avals, XVals, PVals), Count = Crosstab (A, X, P)
Drukuj („tablica 1 zawiera:”, Avals)
print ('\ Narray 2 zawiera:', XVals)
druk ('\ Narray 3 zawiera:', PVals)
print („\ n liczba crosstab to: \ n ', liczba)


Zobaczmy teraz następujące dane wyjściowe, aby zrozumieć, jak zmienia się wynik Crosstab:


Ponieważ mieliśmy trzy zestawy danych, pierwszy zestaw danych zawiera dwa unikalne elementy - A i B. Drugi zestaw danych zawiera trzy unikalne elementy - X, Y i Z. A trzeci zestaw danych zawiera dwa unikalne elementy - 0 i 1. Mamy następujące pary (a, x, 0), (a, x, 1), (a, y, 0), (a, y, 1), (a, z, 0), (a, z, 1), (b, x, 0), (b, x, 1), (b, y, 0), (b, y, 1), (b, z, 0), (b, z, 1) , z liczbami [[[2 0] [0 2] [2 0]] [[0 2] [2 0] [0 2]]]],.

Przykład 3:

Jak wiemy, Crosstab przyjmuje dwa opcjonalne parametry - jeden to poziomy, a drugi jest rzadki. W tym przykładzie poprowadzimy Cię, jak jawnie podać parametry poziomu i jak zarządza nią funkcja Crosstab. Rozważ następujący przykład:

od Scipy.statystyki.import awaryjny Crosstab
a = [„a”, „a”, „a”, „b”, „b”, „b”, „a”, „a”, „a”, „b”, „b”, „b” ]
x = ['x', „y”, „z”, „x”, „y”, „z”, „x”, „y”, „z”, „x”, „y”, „z” ]
opt = [„a”, „b”, „x”, „y”, „z”]
(Avals, XVals), Count = Crosstab (a, x, poziomy = (opt, opt))
Drukuj („tablica 1 zawiera:”, Avals)
print ('\ Narray 2 zawiera:', XVals)
print („\ n liczba crosstab to: \ n ', liczba)


Jak wcześniej dyskutowaliśmy, liczba poziomów powinna być taka sama jak liczba zestawów danych. Podajemy więc poziomy = (opt, opt), aby dopasować liczbę zestawów danych. Zobaczmy tabelę awaryjnych w następującym wyjściu:

Przykład 4:

Drugi opcjonalny argument funkcji Crosstab jest rzadki. W tym przykładzie wyraźnie zdefiniujemy rzadki parametr jako true, aby uzyskać rzadką matrycę w wyniku. Rozważ przykładowy kod w następującym fragmencie kodu:

od Scipy.statystyki.import awaryjny Crosstab
a = [„a”, „a”, „a”, „b”, „b”, „b”, „a”, „a”, „a”, „b”, „b”, „b” ]
x = ['x', „y”, „z”, „x”, „y”, „z”, „x”, „y”, „z”, „x”, „y”, „z” ]
opt = [„a”, „b”, „x”, „y”, „z”]
(Avals, XVals), Count = Crosstab (a, x, poziomy = (opt, opt), rzadkie = true)
Drukuj („tablica 1 zawiera:”, Avals)
print ('\ Narray 2 zawiera:', XVals)
print („\ n rzadka matryca to: \ n ', liczba)
wydruku („\ n liczba crosstab to: \ n ', liczenie.A)


Oto wyjście funkcji Crosstab, która zawiera wszystkie wymagane i opcjonalne parametry:

Wniosek

Ten artykuł jest szybkim przeglądem funkcji Crosstab dostarczonej przez Bibliotekę Scipy. Crosstab oznacza tabelę krzyżową. Służy do uzyskania tabeli awaryjnej podanych danych. Obejmuje listę zestawów danych, liczy nieprzewidziane elementy podane w zestawie danych i zwraca tablicę zliczeń. Za pomocą przykładów nauczyliśmy się, jak podać różne parametry funkcji i uzyskać pożądany wynik.