Kopia panda

Kopia panda
Python jest silnym językiem do analizy danych, głównie ze względu na silny ekosystem narzędzi z ukierunkowanych na dane. Pandy jest jednym z tych narzędzi, które ułatwiają prostsze importowanie i analizę danych.

Najbardziej znaczące struktury danych biblioteki Pandy są ramki danych i serie. Wewnętrznie te struktury danych są zdefiniowane przez tablice indeksu, które oznaczają tablice danych i danych, które przechowują oryginalne dane. Możemy to zrobić, wykorzystując pandy „DataFrame.Metoda kopii () ”.

Metoda kopiowania panda

Metoda kopiowania jest stosowana do kopiowania określonej ramki danych. Rałkę danych można skopiować na dwa sposoby: „Głęboka kopia” i „płytka kopia”. Funkcja „Głęboka kopia” buduje ramkę danych zawierającą kopię określonej zawartości i indeksów DataFrame. Metoda „płytkiej kopii” generuje nową ramkę danych bez kopiowania treści lub indeksów obiektu dzwoniącego- tylko wskaźniki do treści i indeksu są kopiowane.

Składnia metody kopiowania jest następująca:

„Deep” to logiczny argument określający, czy należy dokonać głębokiej lub płytkiej kopii. „Głęboka kopia” to domyślne ustawienie metody. Ustaw wartość parametru „głęboką” na „false”, aby umożliwić płytkie kopiowanie.

Spójrzmy na praktyczną demonstrację tej metody.

Przykład: Korzystanie z PandaS DataFrame.Metoda kopii ()

Do implementacji użyliśmy narzędzia „Spyder”. Otwórz nowy plik Pythona w narzędziu „Spyder”. Najważniejszym wymogiem przy rozpoczęciu pisania skryptu jest import odpowiednich bibliotek. Ponieważ musimy wdrożyć metodę „pandy”, dlatego używamy „importu pandy jako PD”, aby uzyskać dostęp do funkcji „pandy”. Następnie zaczynamy nasz główny kod Pythona.

Utworzyliśmy ramkę danych, wykorzystując „PD.Metoda dataFrame () ”. Rama danych jest inicjowana przez dwie kolumny „nazwa” i „wiek”. Obie kolumny DataFrame przechowują tę samą długość wartości. Pierwsza kolumna „Nazwa” ma pięć wartości, które to „Charlie”, „Bush”, „Harry”, „Robert” i „Albert”. Druga kolumna „Wiek” przechowuje również pięć wartości o danych INT, które wynoszą „25”, „33”, „18”, „29” i „20”. Stworzyliśmy zmienną „demo” do przechowywania nowo skonstruowanej ramki danych.

Teraz możemy uzyskać dostęp do naszego DataFrame, używając tej zmiennej „demo”. Używamy metody „print ()” do wyświetlania tekstu „faktyczna ramka danych”. Następnie wywołaj inną metodę „print ()” do wyświetlania ramki danych.

Naciśnij przycisk „Uruchom plik” na narzędziu „Spyder”, aby zobaczyć wyjście na terminalu. Wynikowy ekran pokazuje nam nowo utworzoną ramkę danych z 2 kolumnami i nagłówkiem na nim.

Po tym, jak to osiągniemy, rozpoczniemy nasze główne zadanie w kodzie Python. W tym celu wykorzystujemy pand „DataFrame.Metoda kopii () ”. Wzywamy „.Kopiuj () ”Metoda o nazwie naszej„ Demo ”danych„ Demo ”. Ponieważ chcemy utworzyć „głęboką kopię” ramki danych, więc używamy funkcji o jej wartości domyślnej, która jest „głęboka = true”. Zmienna „demo_dcopy” jest tworzona do przechowywania wyjścia wywołania „.Metoda kopii () ”. Możemy teraz uzyskać dostęp do tej „głębokiej kopii” rzeczywistej ramki danych przez zmienną „Demo_dcopy”. Zastosujemy funkcję „print ()”, aby wyświetlić tekst „głęboka kopia faktycznej ramki danych:” i do wykazania zawartości zmiennej „demo_dcopy”.

Jeśli wykonamy powyższy kod, na konsoli wyświetlane są dwie struktury danych. Pierwszy to faktyczna ramka danych, podczas gdy druga to „głęboka kopia” rzeczywistej ramki danych. Widzimy, że wszystkie treści i indeksy faktycznej ramki danych są kopiowane w „głębokiej kopii”.

Teraz sprawdźmy, co stanie się w „głębokiej kopii”, jeśli wprowadziliśmy pewne zmiany w rzeczywistej ramie danych. Do wprowadzenia pewnych modyfikacji używamy właściwości „ILOC”, która służy do zlokalizowania określonego indeksu. Napisz nazwę rzeczywistej „demo” z „Demo” za pomocą „.ILOC ”i określ lokalizację indeksu„ [0, 1] = 3 ”, która zlokalizuje pierwszą wartość kolumny„ wiek ”w rzeczywistej ramce danych i zmieni ją na„ 3 ”. Ponownie przywołujemy metodę „print ()”, aby wyświetlić faktyczną „demo” z zmianami i „głęboką kopią” rzeczywistej „Demo_dcopy”, aby sprawdzić, czy zmiany w niej odzwierciedlają, czy nie.

Dane wyjściowe na terminalu pokazuje nam dwieFrame po zmodyfikowaniu wartości w rzeczywistej ramce danych. Możesz zauważyć, że faktyczna kolumna „wiek” „wiek” ma swoją pierwszą wartość zmienioną z „25” na „3”. Podczas gdy „głęboka kopia” rzeczywistej ramki danych z modyfikacją nie odzwierciedla żadnych zmian, co oznacza, że ​​wszelkie zmiany dokonane w rzeczywistej ramie danych nie zmieniają „głębokiej kopii” tegoframki danych.

Teraz zbadamy, co się stanie, jeśli zbudujemy „płytką kopię” początkowej ramki danych.

W przypadku tej ilustracji wykorzystujemy powyższą ramkę danych. Musimy teraz wykonać płytką kopię rzeczywistej ramki danych po jej wydrukowaniu. Korzystamy z pandy „DataFrame.Metoda kopiowania () ”ponownie w taki sam sposób, jak używaliśmy go w powyższym przykładzie„ głębokiej kopii ”z jednym wyjątkiem. Tutaj zmieniamy wartość „głębokiej” właściwości na „false”, aby utworzyć „płytką kopię” rzeczywistej ramki danych. Więc napiszmy to „Demo.kopia (głęboko = false) ” . Stworzyliśmy zmienną „demo_scopy”, aby przechowywać wynik wywoływania „.copy () ”metoda, która będzie„ płytką kopią ”rzeczywistej strumienia danych. Następnie zastosowaliśmy metodę „print ()” do wyświetlania tekstu „płytka kopia rzeczywistej ramy danych:” i do wykazania treści przechowywanej w zmiennej „demo_scopy”.

Dane wyjściowe pokazuje 2Frame DataFrame. Pierwszy to faktyczna ramka danych, podczas gdy druga to „płytka kopia”. Widzimy, że wszystko od rzeczywistej ramki danych jest kopiowane do jego „płytkiej kopii”.

Teraz badamy, co by się stało z „płytką kopią”, jeśli przeprowadzimy pewne modyfikacje w rzeczywistej ramie danych. W tym celu wykorzystujemy „DataFrame.ILOC ”właściwość. Tutaj chcemy, aby właściwość „ILOC” uzyskuje dostęp do indeksu „3” kolumny „Age” w rzeczywistej ramce danych i zmieniła ją na „-5”. Następnie wywoływana jest funkcja „print ()” w celu wyświetlenia tekstu „Rzeczywista ramka danych po modyfikacji:”, a także do wyświetlenia rzeczywistej „demo” danych „demo”. Ponownie wywoływana jest metoda „print ()”, aby wyświetlić tekst „płytka kopia DataFrame po modyfikacji:” i zawartość zmiennej „demo_scopy”.

Wyjście pokazuje rzeczywistą ramkę danych ze zmienioną wartością „-5”, w której numer indeksu wynosił „3”. Po dokonaniu zmian w rzeczywistej „Demo”, wyświetlamy jego „płytką kopię”, która wyświetla te same zmiany, które wprowadziliśmy w rzeczywistej ramce danych. Oznacza to, że wszelkie zmiany dokonane w rzeczywistej ramce danych zostaną również odzwierciedlone w jego „płytkiej kopii”.

Wniosek

Ten samouczek jest przewodnikiem, aby zrozumieć koncepcję i pomysł stworzenia kopii ramki danych. Wprowadziliśmy Cię do pandy „DataFrame.Metoda kopii () ”. Wyjaśniliśmy również dwa różne podejścia do skopiowania ramki danych: głęboka kopia i płytka kopia.