Wyodrębnia pandów z datytu

Wyodrębnia pandów z datytu
„Pandy” to silny pakiet Python, który jest wykorzystywany do wysokiej wydajności i wskaźnika obliczeń. Kolumna datetime w „Pandy” stanowi obszerne źródło danych szeregów czasowych, które mogą być korzystne. Na przykład możesz chcieć przeglądać swoje dane rocznie lub co miesiąc. Uczenie się, jak szybko wyodrębnić takie informacje, może być bardzo korzystne w przypadku ramek danych zawierających kolumny (y) datetime. W tym artykule zbadamy, jak używać pandy do pobierania danych z roku z kolumny DATETIME DATETIME.

Rok wyodrębnia pand z Datetime:

Kolumny datetime „Pandy” zawierają atrybuty takie jak rok, miesiąc, dzień i tak dalej. Aby pobrać rok z kolumny DATETIME ramki danych, po prostu zapoznaj się z jego atrybutem „rok”. „Pandy” mają wiele prostych metod wyodrębnienia komponentów z obiektu datetime, z których zaimplementujemy dwa w tym samouczku. Składnia tych metod podano poniżej:

Pd.DateTimeIndex ().rok

df.dt.rok

Teraz zobaczymy praktyczne wdrożenie tych metod Pythona.

Przykład nr 1: Wykorzystanie „PD.DateTimeIndex ().Metoda roku ”do wyodrębnienia lat z kolumny DataFrame

W tej ilustracji użyjemy pierwszej wspomnianej powyżej metody: „PD.DateTimeIndex ().rok, aby wyodrębnić lata z ramki danych.

Do praktycznego wdrażania tej metody w programie Python wykorzystaliśmy narzędzie „Spyder”. Zaczęliśmy pisać scenariusz w pliku Python. Pierwszą i fundamentalną rzeczą tutaj jest aktywacja zestawu narzędzi do pand. Python zostaje poinstruowany, aby załadować bibliotekę pandy do naszego obecnego środowiska pracy w sekcji Import Pandas w kodzie. Sekcja „PD” kodu instruuje Pythona, aby przypisał panel pandę „PD”. W ten sposób możemy uzyskać dostęp do wszystkich funkcji pandy. Następnie utworzyliśmy ramkę danych.

Rama danych jest generowana przez zastosowanie metody panda „PD.Ramka danych()". Przywołaliśmy tę metodę i zainicjowaliśmy ją czterema kolumnami: „Tytuł”, „Wykłady”, „Grade” i „Start_Date”. Pierwsza kolumna „Tytuł” ​​przechowuje tytuły różnych języków programowania. Są to „C ++”, „Python”, „Java” i „R”. Druga kolumna, którą utworzyliśmy w ramce danych, to „wykłady” i zawiera liczbę wykładów dla każdego kursu jako „30”, „26”, „35” i „20”. Kolumna „Grade” mówi poziom, na którym oferowane są te kursy, ja.mi., „12”, „10”, „14” i „16”. Ostatnia kolumna to podstawowe dane tej ramki danych, ponieważ przechowuje wartości datetime, na których opiera się ten samouczek. Ta kolumna ma wartości „02-02-2022”, „09-01-2023”, „07-29-2024” i „11-24-2025” jako daty początkowe każdego kursu.

Długość kolumny, którą wzięliśmy dla każdej kolumny, wynosi cztery. Potrzebujemy obiektu ramy danych, aby przechowywać zawartość ramki danych. Więc utworzyliśmy obiekt ramki danych „wyciąg” i biorąc pod uwagę jego wynik, który można by osiągnąć, wywołując „PD.Metoda dataFrame () ”. Najczęściej wykorzystywana metoda Pythona do wyświetlania danych wyjściowych „print ()” jest tutaj wywoływana w celu wykazania zawartości obiektu ramy danych „wyodrębniania”.


Po wykonaniu wspomnianego powyżej programu otrzymujemy wyświetlanie na konsoli, która ma cztery kolumny. Tutaj widać, że kolumna „start_date” przechowuje wartości datetime.


Teraz musimy iść naprzód, aby zacząć od naszego głównego zadania, dla którego wygenerowaliśmy ramkę danych. Wyodrębnimy rok z kolumny DATETIME naszej ramki danych za pomocą „PD. DateTimeIndex ().Metoda roku ”tutaj.

Przywołaliśmy „PD.DateTimeIndex ().Metoda roku ”zaraz po utworzeniu i wydrukowaniu ramki danych. ".Rok ”określa, że ​​używamy tej metody do wyodrębnienia roku z konkretnej kolumny DATETIME. Może mieć również inne atrybuty, i.mi., ".miesiąc ”, aby wyodrębnić miesiące,„.Tydzień ”, aby odzyskać tygodnie„.dzień ”, aby zdobyć dni i wiele innych. Nazwaliśmy tę funkcję i między jej nawiasami podaliśmy nazwę DataFrame z nazwą kolumny, na której stosuje się funkcję, aby wyodrębnić lata z niej.

Nazwa ramy danych „wyciąg” jest dostarczany do kolumny „start_date” o wartościach danych. Gdy ta funkcja zostanie wywołana, dostanie się do ramki „wyodrębniania” i, z kolumny „start_date”, odzyskaj lata. Teraz, aby przechowywać te lata, stworzyliśmy nową kolumnę „rok” w naszej ramce „wyciągu” danych. Tak więc lata wyodrębnione z wywołania „PD.DateTimeIndex ().Rok ”będzie przechowywany w kolumnie„ roku ”. Następnie zastosowaliśmy metodę „print ()” do wyświetlania zaktualizowanej ramki danych.


Tutaj mamy wynikającą ramkę danych. Widzimy, że ta komplet danych ma nową kolumnę „rok”, który zawiera lata jawnie, wyodrębnioną z kolumny „start_date” odpowiadającej każdej zawartej wartości, którą zawiera.

Przykład nr 2: Wykorzystanie „DF.dt.Metoda roku ”do wyodrębnienia lat z kolumny DATETIME ramki danych

Ta demonstracja wyjaśni, jak wyodrębnić rok z kolumny Datetime z wykorzystaniem pandy „DF.dt.Metoda roku ”. Zobaczmy, jak to działa.

Właśnie otworzyliśmy narzędzie „Spyder” i zaczęliśmy pisać kod. Załadowaliśmy bibliotekę pandy, ponieważ metodą, którą chcemy tutaj wykorzystać, jest funkcją pandas i możemy ją użyć tylko wtedy, gdy mamy załadowaną tę bibliotekę w naszym bieżącym pliku Python. Następnie utworzyliśmy ramkę danych za pomocą „PD.Metoda dataFrame () ”. Przywołaliśmy funkcję i stworzyliśmy trzy kolumny w niej, które są „nazwą”, „datkiem nr urodzonym” i „wiekiem”. Kolumna „Nazwa” przechowuje nazwiska niektórych osób, które są „Parker”, „Jack”, „Leo” i „Rabecca”. „Data Birth_date” przechowuje datę urodzenia tych ludzi jako „02-02-1989”, „09-01-1996”, „07-29-1981” i „11-24-2001”.

Kolumna „Wiek” zawiera ich obecny wiek odpowiednio jako „32”, „26”, „40” i „21”. Utworzyliśmy obiekt ramki danych „biodata” do przechowywania wyjścia z „PD.Funkcja dataFrame () ”. Następnie wywoływana jest metoda „print ()”, aby wyświetlić wynikową ramkę danych zapisaną w obiekcie „biodata”.


Kiedy uruchamiamy ten fragment kodu, otrzymujemy ramkę danych z trzema dostarczonymi kolumnami, które można zobaczyć w migawce dołączonej poniżej.


Teraz użyjemy tej ramki danych do wyodrębnienia roku z jego kolumny DATETIME przy użyciu „DF.dt.Metoda roku ”. Tutaj kolumna „data_ urodzin” zawiera daty z rokiem, więc musimy zastosować funkcję do tej konkretnej kolumny, aby wyodrębnić rok. Aby użyć tej kolumny, musimy najpierw przekonwertować ją na format datetime. Ponieważ funkcja, której tu używamy, zawiera atrybut „DT”, który jest dla danych. Więc wykonuje się tylko wtedy, gdy określona kolumna zostanie przekonwertowana na datetime. Aby to zrobić, zastosowaliśmy metodę pandy „to_dateTime ()” i dostarczyliśmy nazwę ramki danych z nazwą kolumny między jej nawiasami.

Teraz danych typu kolumny „Birth_Date” został zmieniony na Datetime. Następnie zadzwoniliśmy do „DF.dt.Funkcja roku ”. Wspomnialiśmy o nazwie ramki danych o nazwie kolumny i „.dt.Rozszerzenie roku ”. Aby przechowywać ten wyodrębniony rok wartości w ramce danych, stworzyliśmy nową kolumnę „rok” w „Biodata”. Wreszcie wyświetliliśmy ramkę danych za pomocą funkcji „print ()”.


To daje następujący wynik.

Wniosek:

Wyodrębnienie roku z kolumny Datetime z ramki danych Pandy jest przydatnym ćwiczeniem. Pandy uczą nas z bardzo przydatnymi i praktycznymi technikami osiągnięcia pożądanego rezultatu. W tym samouczku wprowadziliśmy do dwóch technik pandy, aby wyodrębnić rok z kolumny Datetime w ramce danych. Opracowaliśmy każdy szczegół w praktycznym wdrożeniu przykładowych kodów. Opisaliśmy i wyjaśniliśmy wszystko, czego użyliśmy w przykładach, abyś nie stawiał czoła trudnościom podczas ćwiczenia tych metod uczenia się pandy.