przypisanie pandy

przypisanie pandy
Korzystając z funkcji Assign () w pandy, możesz dodać nowe segmenty do ramki danych, jednocześnie przywracając duplikat oryginalnego elementu. Nowo przydzielone sekcje zastąpią istniejące. Jednym z pakietów, które sprawiają, że gromadzenie i badanie informacji są bardziej dostępne, są pandy. Wybieramy zmieniającą się pracę, określamy kryteria, na podstawie których należy zastosować każdą z tych modyfikacji, a następnie przekazuje ją do kilku przypisanych funkcji. Gdy istnieją dwa argumenty, typ docelowy jest ten, który mówi nam, które rodzaje powinniśmy spróbować. Z jednym wyjątkiem omówimy za sekundę, będzie to oczywiście takie samo jak typ początkowy.

Jak używać funkcji Assid () w pandy

Aby użyć funkcji Assign () w pandy, najpierw musimy zrozumieć jej składnię.

Składnia: Ramka danych.przypisz (** argumenty słów kluczowych, ja)

Gdzie,

Argumenty słów kluczowych: Nazwy kolumn i hasła służą jako argumenty słów kluczowych. Jeśli cechy można wywołać, przetwarza je i przypisuje je do nowych kolumn DataFrame. Mimo że pandy tego nie sprawdzają, przywołanie nie może zmienić wejścia danych danych. Jeśli właściwości, takie jak serie lub klastry, nie można nazwać. W pewnym sensie są przydzielone. Słownik sznurków lub list może być używany jako argumenty słów kluczowych.

samego siebie: Zwraca zupełnie nową ramkę danych z kolumnami, które zostały dodane do istniejących jako wyjście.

Możemy teraz zrozumieć, jak działa funkcja pandas (). W każdym razie nie możemy znacząco zmniejszyć rozmiaru naszej strumienia danych, ponieważ liczba 64 bajtów zajmuje taką samą przestrzeń jak 64 bajty sznurków lub wartości zmiennoprzecinkowych, podobnie jak 100 funtów cegieł waży to samo jak 100 funtów bloków. Uprościliśmy proces późniejszego zniechęcenia tych segmentów. Mamy tutaj niewiarygodnie niewiele cech, więc jeśli stworzymy możliwość, która przyjmuje podzbiór podzbioru kolumny i próbuje ustalić ją do najmniejszej formy, jaką może być możliwość obsługi. Poniższe przykłady pomogą Ci lepiej to zrozumieć.

Przykład 1: Używając funkcji Assid () w pandy

Temperatura zostanie obliczona w tym przykładzie za pomocą metody Assid (). Podczas gdy moduł Numpy działa głównie z danymi numerycznymi, moduł pandas działa przede wszystkim z danymi tabelarnymi. Po zaimportowaniu modułów utworzymy ramkę danych, na której możemy zastosować funkcję Assid ().

Funkcja Lambda ma taki sam potencjał do zachowania jak funkcja standardowa określona za pomocą słowa kluczowego Pythona def. Możemy zobaczyć naszą ramkę danych za pomocą funkcji print () i przekazać nazwę naszej ramki danych po zastosowaniu funkcji Assign (), i.mi., „Df_assign” jako argument w funkcji print (). Możesz to również zilustrować, pisząc nazwę ramki danych.

Numpy jest importowany po pandy w wcześniej wspomnianym skrypcie. Temperatury obu krajów są następnie rejestrowane w miarę generowania dla nich DataFrame i indeksu DataFrame. Na koniec wykorzystujemy metodę Assign () do obliczania temperatur za pomocą równania dostarczonego programu. Kiedy przypisujemy funkcję drukowania, zmienna DF, która reprezentuje ramkę danych, oblicza równanie matematyczne i drukuje wcześniej widoczne wyjście. Funkcja Assid () kalibruje równanie, które rozważa zmienne. Aby przekonwertować z stopni Fahrenheita na stopnie Celsjusza, 32 jest dodawane do wartości tej zmiennej „A” wraz z Lambda. Następnie polecenie uzupełnia to równanie i wysyła wyniki.

Przykład 2: Nowe tworzenie zmiennych i stałe przypisanie

Przed uruchomieniem któregokolwiek z tych przykładów musisz zaimportować pandy i stworzyć niezbędną ramkę danych.

Nazwaliśmy naszą DataFrame „S-data”. Ta struktura danych zawiera zmienne dotyczące sprzedaży i wydatków oraz symulowane dane dotyczące sprzedaży dla każdej osoby. Możemy stąd dodać kilka dodatkowych zmiennych, używając metody Assign ().

Jeśli wszystkie osoby w tym zestawie danych są zatrudnione przez tę samą firmę lub firmę, powiedzmy, że pracujesz z tymi informacjami. W przeciwieństwie do „S_DATA”, który zawiera tylko dane pracowników pracujących dla tej samej firmy, inne struki danych mogą mieć rekordy dla sprzedawców, którzy pracują dla różnych firm. Co jeśli chcielibyśmy stworzyć zmienną dla osób w tej ramce danych zawierającej nazwę ich firmy? Dzięki funkcji Assign () możemy dokonać następujących czynności:

W tym przypadku dodaliśmy nową zmienną o nazwie „biznes”. Wartość zmiennej biznesowej jest taka sama dla każdego wiersza danych. Mówi „sprzęt” jako wartość. Technicznie rzecz biorąc, wartość jest taka sama dla każdego wiersza. Jest to wartość ciągu, a bardziej precyzyjna. Po stwierdzeniu, że podczas tworzenia zmiennych o stałych wartościach, z ciągłymi danymi lub wartościami numerycznymi, możemy przypisać nową zmienną oprócz dodawania wartości tekstowych, jak w tym przykładzie.

Przykład 3: Dodaj obliczoną zmienną wartości z metodą Assid ()

W tym przykładzie użyjemy tej samej ramki danych „s_data”. Mówiąc dokładniej, dodamy „zysk” jako nową zmienną, równą sprzedaż minus koszty (eksperci finansowe i rachunkowości będą wiedzieć, że nie jest to dokładna metoda obliczania zysku; jednak wykorzystamy to wypaczone obliczenia jako przykład.).

Korzystając z tego kodu, otrzymamy następujące dane wyjściowe:

W takim przypadku dodaliśmy nową obliczoną kolumnę o nazwie „Zysk”. Zysk, jak widać, to tylko koszty odejmowania sprzedaży. Pamiętaj jednak, że musimy używać nazw „s_data.sprzedaż ”i„ s_data.wydatki ”w celu odniesienia się do zmiennych sprzedaży i wydatków wewnątrz Assign (). Możemy również nazywać je „s_data [„ wydatki ”]” i „s_data [„ sprzedaż ”]”. Możesz wybrać dowolny, ale w tym przykładzie zostanie użyty wcześniej pokazany.

Przykład 4: Dodanie wielu kolumn za pomocą funkcji Assid ()

W tym przykładzie dodamy dwie zmienne jednocześnie. Zostaną dodane zmienne „biznesowe” i „zysku”. Użyjemy tych samych ram danych z poprzednich przykładów 2 i 3, i.mi., s_data.

Zmienne „zysk” i „biznes” są dodawane jednocześnie w tym przykładzie. Zobaczysz, że założyliśmy nową linię kodu dla drugiej zmiennej pod względem składni. Jeśli chcesz, możesz zachować cały swój kod na jednym wierszu, chociaż nie sugeruję tego szczególnie. Bezpośrednie nadpisanie oryginalnych danych to kolejna opcja.

Po prostu wykonaj metodę przypisania i wyślij wyniki do „S_DATA” określona w oryginalnej nazwie DataFrame. W niektórych sytuacjach robienie tego jest całkowicie odpowiednie. Czasami możesz całkowicie wymienić swoje dane.

Wniosek

Podsumowujemy, stwierdzając, że funkcja Assign () w pandy umożliwia nam wykonywanie różnych zadań, tworząc odniesienie do słów nazwy sekcji. W tym samouczku zaimplementowaliśmy różne przykłady, aby uczyć, jak korzystać z funkcji Assign (), jak dodać nową kolumnę ze stałą wartością lub danymi, jak dodać kolumnę z wartościami obliczonymi i jak dodać wiele kolumn w ramce danych Za pomocą funkcji Assign ().