Metoda informacyjna pandy

Metoda informacyjna pandy
„Moduł pandas Pythona służy do modyfikowania zestawów danych. Oferuje narzędzia do badań danych, filtrowania, przetwarzania i manipulacji. Doskonała społeczność informacji Pythona pakietów Pythona sprawia, że ​​jest to skuteczny język do przeprowadzania analizy danych. Jedno takie narzędzie, pandy, znacznie upraszcza proces importowania i analizy danych. Korzystając z funkcji info (), możesz szybko podsumować ramkę danych. Ta metoda wyświetla szczegółowe informacje na temat ramki danych, takich jak jego wartości nie-zerowe, wykorzystanie pamięci oraz typy danych indeksu i kolumny do wydrukowania pełnego podsumowania. Drukuje tylko dane zawarte w dostarczonej ramce danych i nie zwraca wartości. Podczas przeprowadzania badań eksploracyjnych informacji jest pomocne. Korzystamy z ramki danych.info () funkcja szybkiego nabycia podsumowania zestawu danych."

Składnia do metody pandas info ()

Będziemy krótko omówić parametry używane tutaj:

Gadatliwy: Zastosowanie tej właściwości pozwala użytkownikowi wybrać, czy wyjaśnić cały raport

BUF: To też nie jest obowiązkowe. Określa, gdzie należy wysłać kolejne wyjście. Przekaż przepisywny bufor, jeśli chcesz więcej zmodyfikować wyjście.

Zużycie pamięci: Wskazuje, czy należy wyświetlić ogólne użycie pamięci elementów danych, w tym indeks. Domyślnie jest to zgodne z wartością pandy. opcje.Wykorzystanie display_memory zawsze wyświetla użycie pamięci jako „prawdziwe”. Nigdy nie wyświetlaj użycia pamięci jest „fałszywe”.

Max_col: Kiedy użyć skróconego wyjścia zamiast wyjścia w pełnym. Obcięte wyjście jest wykorzystywane, jeśli ramka danych zawiera więcej kolumn niż limit maks. Wyświetl opcje pandy.Max _info_ kolumny Wartość jest domyślnie wykorzystywana.

null_counts: Służy do wskazania, czy wyświetlać liczbę zerowych.

Przykład nr 1: Wyświetl podsumowanie ramki danych za pomocą metody informacyjnej z wartością wetbose True

Porozmawiamy o Python Pandas DataFrame.Metoda info () w tej demonstracji. Aby uzyskać raport z ramki danych, używamy tej metody. Ta funkcja wyświetla informacje o zestawie danych, takie jak typ indeksu i kolumny, wartości nie-null i zużycie pamięci, gdy jest wywoływana do ramki danych. Porozmawiajmy teraz o przykładzie. W tym przykładzie użyliśmy trzech kolumn; „Liczby całkowite”, „postacie” i „wartości pływakowe”. W kolumnach „liczba całkowita” znajdują się cztery liczby całkowitej, „7”, „8”, „9” i „10”. Wybraliśmy cztery wartości dla postaci „dodanie”, „odejmowania”, „mnożenia” i „podziału”. W kolumnie mamy „wartość zmiennoprzecinkową”, ma te wartości „1.1 ”,„ 1.2 ”,„ 1.3 ”i„ 1.4 ”.

Następnie przeszliśmy tę listę wartości, aby wygenerować ramkę danych, stosując „PD.Metoda ramki danych dostarczona przez moduł pandy w celu konstruowania ramki danych. Przypisaliśmy nowe etykiety do tej listy „Liczba całkowita” jako „int”, „charakter” jako „char” i „float_values” jako „float”; Te etykiety będą tytułami kolumn naszej ramy danych wyjściowych. Oświadczenie „Opis ramki danych” jest wyświetlane za pomocą funkcji „print ()”.

Następnie dochodzimy do głównej funkcji programu, którym jest metoda ramy danych „info ()”. Ramka danych.Funkcja informacyjna służy do uzyskania prostego przeglądu ramki danych. „DF.info () ”jest używany tutaj do przedstawienia przeglądu kodu. W takim przypadku parametr, który przekazaliśmy do tej funkcji, jest „Porozumiany”. Ten parametr ma dwie możliwe wartości; "prawda czy fałsz". „Verbose = True” Używany tutaj oznacza wyświetlanie całych informacji ramy danych. „True” Wykorzystanie pamięci wyświetlania. Dlatego używamy „DF.info (Verbose = true) ”, która drukuje wszystkie informacje o ramce danych.

Jak pokazano w wyniku, wyświetla podsumowanie kodu; Po pierwsze, informuje nas o klasie, czyli „pandy.rdzeń.rama.DataFrame ”Pokazuje, że zakres indeksu, jaki mamy w tym przykładzie, to„ 4 ”, co oznacza, że ​​informacje, które wprowadziliśmy w tym kodzie, są indeksowane od 0 do 3; w ten sposób są wpisy od 0 do 3. „Kolumny danych” w następujących wskazówkach wskazują, że istnieją trzy kolumny. Pierwsza kolumna wymienia nazwy kolumn, druga kolumna wymienia liczbę nie-null, a trzecia kolumna zawiera typy danych dla wprowadzonych danych. W końcu wspomina, że ​​typy danych to „float64 (1)”, „int64 (1)” i „obiekt (1)”, a to używa 224.0+ bajtów pamięci.

Przykład nr 2: Wyświetlanie podsumowania poprzez zastosowanie metody info () z wartością wetbose Fałsz

Podanie naszego drugiego przykładu poprzez importowanie modułu pandy. W tej procedurze tworzona jest ramka danych z trzema kolumnami. Jego pierwsza kolumna odnosi się do „liczby całkowitej”, drugiej jako „postaci”, a trzeciej jako „wartości pływakowe”. Mamy trzy wartości w kolumnie „Liczba całkowita”, które są „4”, „5” i „6” oraz w kolumnie „znaki”, mamy trzy zmienne „a”, „b” i „c” oraz dla kolumny „Wartości pływakowe”, mamy „2.2 ”,„ 1.2 ”i„ 3.3 ”. Ponieważ rozmiar indeksu wynosi „3”, oznacza to, że mamy wpisy od „0” do „2."

W tym przykładzie metoda „info ()” jest używana do uzyskania raportu szybkich danych bez wyświetlania użycia pamięci. Używanie prawdziwej lub fałszu w sprawdzonej liczbie to wskazanie, czy wydrukowanie pełnych informacji jest opcjonalne. Rama danych zostanie teraz wyświetlona przy użyciu „PD. ramka danych".

Tak więc, używając funkcji „print ()”, wyświetlamy instrukcję „szczegół” w następnym etapie. Następnie drukujemy funkcję „DF.informacje (Verbose = false) ”. Korzystanie z tej funkcji zapewni nam zwięzły przegląd kodu. Zamiast drukowania całej ramki danych i nakreślenie jej zawartości, metodę tę zastosowano do zwięzłego wyjaśnienia kodu. Teraz za pomocą DF.informacje (Verbose = false) ”po prostu wyświetli„ szczegóły ”i opisze je.

Wyjście pokazuje, że „szczegóły” jest dość zwięzłe i jasne. Ponieważ w poprzednim przykładzie użyliśmy „Verbose = True”, wyświetlono całe podsumowanie kodu i ramkę danych; Jednak użyliśmy w tym Verbose = False, więc wyświetliło to bardzo krótkie podsumowanie. Innymi „szczegółami” najpierw pokazuje „klasę”, jaką jest „Pandy.rdzeń.rama.ramka danych".

„Zakres indeksu” jest wyświetlany w następnym wierszu, który jest „3”, wskazując, że zakres wpisów jest od „0 do 2”, wówczas wskazuje liczbę kolumny, w której istnieją trzy kolumny; być może przedstawione są typy danych danych, które mamy w ramce danych. „Float64 (1)”, „Int64 (1)”, „Int64 (1)” i obiekt (1) to typy danych.

Obiekt nie jest typem danych, ale tutaj jest używany dla znaku. Następny wiersz wyświetla użycie pamięci, które wyświetla ilość pamięci, która jest bezpłatna w systemie, oprócz tego, ile pamięci są używane przez wszystkie otwarte programy, w tym system Windows. Rozmiar użycia pamięci wynosi „200.0+ bajtów) ”.

Wniosek

W tym artykule rozmawialiśmy o funkcji info (). Funkcja informacyjna pandy opisuje ramkę danych. Gdybyśmy krótko podsumowali artykuł w pierwszym przykładzie, utworzylibyśmy ramkę danych, w której weźmiemy trzy kolumny „liczby całkowite”, „znak” i „Float_values”. Mamy pewne wartości w tych kolumnach. Mamy indeks z czterema wpisami, od „0 do 3”. Za pomocą „DF.informacje.(Verbose = true) ”Funkcja dokładnie wyświetli całe podsumowanie ramki danych. Rama danych z niektórymi kolumnami jest tym, co mamy w drugim przykładzie. Ma trzy wpisy w naszym indeksie, ponumerowane „0 do 2”. Funkcja „DF.informacje.(Verbose = false) ”wyświetli krótki przegląd kodu. Ten artykuł może ułatwić zrozumienie metody Info () Panda.