Pandas Wstaw kolumnę

Pandas Wstaw kolumnę

Pandy upraszczają wiele żmudnych, czasochłonnych zadań związanych z pracą z danymi. Kolumny w ramce danych można również dostosować wraz ze źródłem danych. Istnieją cztery sposoby dodania kolumny do ramki danych w Pandaas, ale w tym artykule używamy funkcji pandas „insert ()”.

Ramka danych.wstawić()

Korzystając z metody „insert ()”, możesz dodawać kolumny między bieżącymi kolumnami, zamiast dodawać je na dole pandas DataFrame. Pozwala nam dodać kolumnę w dowolnym miejscu, a nie po prostu na zakończenie. Dodatkowo oferuje wiele sposobów dodania wartości dla kolumn. Po dodaniu kolumny w określonej pozycji lub indeksie funkcja pandas „insert ()” jest przydatna.

Składnia

Pandy.Ramka danych.wstaw (pozycja, „kolumna”, [wartości…])

Parametry

  1. „Pozycja” jest pierwszym parametrem, który odnosi się do pozycji indeksu kolumny, w której kolumna musi zostać wstawiona.
  2. „Kolumna” to nowa nazwa kolumny
  3. Wartości są umieszczane na liście i wkładane do kolumny.

Przykład 1

W tym przykładzie mamy ramkę danych o nazwie „rzeczy”, która zawiera kolumny „nazwa” i „zakupionego statusu”.

Dodajmy nową kolumnę o nazwie „koszt” z wartościami.

importować pandy
rzeczy = pandy.DataFrame („name”: [„Solar Dish”, „okulary”, „olej”],
„Zakupiony status”: [1,0,0])
Drukuj (rzeczy)
# Włóż kolumnę „kosztu” do powyższej danych danych w indeksie 2
rzeczy.Wstaw (2, „koszt”, [890.0,98.0,67.91])
wydrukować()
Drukuj (rzeczy)

Wyjście

Nazwa zakupiona status
0 Słoneczne danie 1
1 okulary 0
2 olej 0
Nazwa zakupiona koszt statusu
0 Słoneczne danie 1 890.00
1 okulary 0 98.00
2 olej 0 67.91

Wyjaśnienie

Określiliśmy pozycję jako 2 w funkcji Insert (). Tak więc kolumna „koszt” jest wstawiany w trzeciej pozycji (wskaźnik - 2). Wreszcie kolumny to [„nazwa”, „zakupiony status”, „koszt”].

Przykład 2

Dodajmy nową kolumnę o nazwie „Recenzja” z wartościami typu ciągów w pozycji 1.

importować pandy
rzeczy = pandy.DataFrame („name”: [„Solar Dish”, „okulary”, „olej”],
„Zakupiony status”: [1,0,0])
Drukuj (rzeczy)
# Włóż kolumnę „przegląd” do powyższej danych danych w indeksie 1
rzeczy.wstaw (1, „recenzja”, [„dobry”, „zły”, „dobry”])
wydrukować()
Drukuj (rzeczy)

Wyjście

Nazwa zakupiona status
0 Słoneczne danie 1
1 okulary 0
2 olej 0
Przegląd nazwiska zakupionego statusu
0 danie słoneczne dobre 1
1 okulary złe 0
2 Dobre oleju 0

Wyjaśnienie

Określiliśmy pozycję jako 1 w funkcji INSERT (). Tak więc kolumna „przegląd” jest wstawiany w drugiej pozycji (indeks-1). Wreszcie kolumny to [„Nazwa”, „recenzja”, „zakupiono status”].

Przykład 3

Utwórz ramkę danych o nazwie zamówienia z 2 kolumnami i wstaw 2 kolumny w indeksie 1 jeden po drugim.

importować pandy
Zamówienia = pandy.DataFrame ('id': [1,2,3,4,5],
„Nazwa”: [„o1”, „o2”, „o3”, „o4”, „o5”])
Drukuj (zamówienia)
# Włóż kolumnę „firmy” do powyższej danych danych w indeksie 1.
Zamówienia.Insert (1, „Company”, [„comp-1”, „comp-2”, „comp-3”, „comp-4”, „comp-5”])
wydrukować()
Drukuj (zamówienia)
# Włóż kolumnę „sprzedaż” do powyższej strumienia danych na indeksie 1.
Zamówienia.Wstaw (1, „Sales”, [10,20,30,56,78])
wydrukować()
Drukuj (zamówienia)

Wyjście

nazwa id
0 1 O1
1 2 O2
2 3 O3
3 4 O4
4 5 O5
Nazwa firmy ID
0 1 Comp-1 O1
1 2 Comp-2 O2
2 3 comp-3 o3
3 4 Comp-4 O4
4 5 Comp-5 O5
Nazwa firmy sprzedaży identyfikator
0 1 10 Comp-1 O1
1 2 20 Comp-2 O2
2 3 30 comp-3 o3
3 4 56 Comp-4 O4
4 5 78 Comp-5 O5

Wyjaśnienie

Po pierwsze, kolejność kolumn to [id, nazwa].

Po dodaniu „firmy” w pozycji 1 kolumny są [identyfikatory.Nazwa firmy].

Po dodaniu „sprzedaży” w pozycji 1, kolumny są [identyfikator.Sprzedaż, firma, nazwa].

Wniosek

Powszechnie używana analiza danych i operacja aktualizacji jest dodawaniem kolumn do DataFrame. Pandy daje wiele opcji wykonania zadania, oferując cztery różne metody. Jednak w naszym artykule wykorzystujemy tylko jedną technikę, jaką jest kolumna pand „insert ()”. Omówiliśmy trzy różne przykłady wstawienia kolumny w istniejącej ramce danych.