Pandy z JSON

Pandy z JSON

Notacja obiektów JSON lub JS to format danych tekstowych, który przechowuje dane tekstowe jako wartość klucza. W Internecie dane są często wymieniane za pośrednictwem plików JSON. Pomiędzy nawiasami kręconymi (), JSON jest reprezentowany. JSON używa przecinków do oznaczenia oddzielenia każdej pary klucza/wartości. Dane JSON przypominają słownik Pythona z wyglądu. Jednak słowniki są struktury danych, podczas gdy JSON jest formatem danych. W Panand Funkcja Read_Json umożliwia odczyt plików JSON na Pandy DataFrame. Możesz zobaczyć w poniższych przykładach, jak przekonwertować pliki JSON na pandas DataFrame Pliki JSON można odczytać w ramce danych pandas.

Jak czytać pliki JSON w pandy?

Używamy funkcji Read_Json () do wyodrębnienia plików mających .rozszerzenie JSON, przekazując ścieżkę pożądanego pliku JSON wewnątrz nawiasów funkcji. Po zrobieniu zwracany jest „DataFrame” (tabela z wierszami i kolumnami do przechowywania danych). Możemy określić link do lokalizacji pliku, a nie na ścieżce lokalnej, jeśli chcielibyśmy pobrać plik JSON, który jest przechowywany na zdalnym serwerze. Czasami może być konieczne przekształcenie pliku za pomocą .Rozszerzenie JSON do Pandas DataFrame. Metoda pandas read_json (), która wykorzystuje następującą składnię, ułatwia to osiągnięcie.

Składnia: Read_Json („ścieżka”, orienter = „indeks”)

Gdzie,

ścieżka: umieszcza ścieżkę pliku JSON.

Orient: orientacja pliku JSON. Wartość domyślna to „indeks”, ale możesz również zdefiniować „podzielone”, „rekordy”, „kolumny” lub „wartości”.

Zobaczmy, w jaki sposób pliki z rozszerzeniami JSON można odczytać w ramce danych w poniższych przykładach.

Przykład 1: Za pomocą funkcji Read_Json () do odczytania pliku JSON

Najpierw musimy pobrać plik JSON ze strony internetowej Open Source. Możemy po prostu pobrać plik z .Rozszerzenie JSON z kilku stron internetowych. Zamiast uzyskać plik JSON z Internetu, możesz alternatywnie utworzyć jeden. Pobierz plik „Iris.JSON „ze strony internetowej Open-Source. Aby odczytać ten plik w pandy, użyjemy funkcji Read_Json ().

Użyliśmy PD.Read_Json () Metoda odczytania pliku lokalnego (.plik JSON) do zmiennej „DF”. Przekazaliśmy ścieżkę pliku JSON jako ciąg do funkcji. Dzięki tej metodzie dane plików JSON zostaną automatycznie przekonwertowane na DataFrame. Pakiet Pandy został początkowo zaimportowany jako PD. W końcowym wierszu wyeksportujemy dziesięć linii przykładowych z DataFrame. Metoda Read_Json () przyjęła 150 wierszy i 5 kolumn danych z pliku danych IRIS jako wejście.

Za pomocą DF.Funkcja próbka (), wyświetliśmy tylko próbkę 5 wierszy danych w tym bloku wyjściowym. Dane Frame Data są losowo pobierane przez funkcję próbki (). Zdefiniowana liczba wierszy (losowych) jest zwracana metodą próbki (). Jeśli wartość nie jest określona, ​​funkcja próbka () zwraca 1 wiersz. Jeśli określamy parametr orientacyjny funkcji Read_Json (.

Przykład 2: Za pomocą funkcji Read_Json () do odczytania plik JSONFILE z zdalnej lokalizacji

Plik znajdujący się w innym systemie CICS (system kontroli informacji o kliencie). Korzystając z wysyłki funkcji CICS, żądania sterowania plikiem CICS wykonane w stosunku do plików zdalnych są wysyłane do systemu zdalnego. Aplikacje można wykonać w celu uzyskania dostępu do plików, nawet gdy są umieszczone w nieznanej lokalizacji/serwerze. Korzystając z zdalnego adresu URL zamiast ścieżki pliku, możemy odczytać dane JSON ze zdalnej lokalizacji. Metoda Read_Json () może odczytać z lokalizacji innych niż tylko pliki lokalne. Można również odczytać pliki JSON utrzymywane na odległych serwerach. Możemy po prostu podać połączenie funkcyjne ze ścieżką do zewnętrznego pliku JSON.

Użyliśmy publicznie dostępnego interfejsu API HTTP, który zawiera dane z formatu JSON. Metoda Read_Json () służy również do odczytu danych JSON ze zdalnego adresu URL. To wyjście zawiera próbkę pięciu wierszy danych JSON za pomocą metody Read_Json (). Dane te pochodzą z publicznego adresu URL i mają 150 wierszy i pięć kolumn.

Przykład 3: Korzystanie z PD.Funkcja dataFrame () do odczytania pliku JSON w PandaS DataFrame

W poprzednich przykładach pobrali plik danych JSON lub użyliśmy zdalnego adresu URL do odczytania danych. Teraz utworzymy dane JSON, a następnie przekonwertujemy je na ramkę danych za pomocą PD.Funkcja dataFrame (). Przed utworzeniem danych JSON lub Pandas DataFrame, musimy zaimportować moduły pandy, aby korzystać z jego funkcji i funkcji.

Nasze dane JSON „J_DATA” są tworzone z dwiema kolumnami: „Nazwa” i „wiek” z wartościami („1”: „Brock”, „2”: „Fin”, „3”: „John”, „4”: „Moris”, „5”: „Jack”, „6”: „Anna”) i („1”: 38, „2”: 26, „3”: 41, „4”: 35, „5”: 28, odpowiednio „6”: 27). Teraz przekazamy nasze dane JSON w PD.Funkcja dataFrame (), aby odczytać go w ramce danych.

Po prostu przekazaliśmy „j_data” w funkcji DataFrame (), aby przekonwertować dane JSON na pandas dataframe.

Przykład 4: Korzystanie z PD.Funkcja dataFrame () w celu odczytania zagnieżdżonych struktur JSON w Pandas DataFrame

W tym przykładzie utworzymy dane JSON za pomocą zagnieżdżonych słowników. W Python możesz użyć zagnieżdżonych słowników do tworzenia danych JSON. W pliku JSON znajduje się kolumna lub zmienna dla każdego elementu w zewnętrznym słowniku. Kluczem każdego elementu jest nagłówek kolumny, a jego dane to kolejny słownik złożony z wierszy w tej konkretnej kolumnie. Utworzymy słownik, którego użyjemy do utworzenia pliku JSON ze szczegółami na temat losowych.

Stworzyliśmy nasze zagnieżdżone dane JSON. Klucze słowników są określone jako „nazwa”, „id”, „kurs” i „wiek”. Teraz użyjemy PD.Funkcja dataFrame () w celu przekonwertowania zagnieżdżonego słownika na pandas DataFrame.

Nasz zagnieżdżony słownik danych JSON jest pomyślnie przekonwertowany na ramkę danych.

Przykład 5: Korzystanie z funkcji JSON_NORMALASE () do odczytania zagnieżdżonych struktur JSON w Pandas DataFrame

Do odczytania zagnieżdżonych ciągów JSON i zwracania ramki danych powszechnie stosowana jest funkcja „JSON_NORMALATES”. JSON.Funkcja Loads () z pakietu Python JSON musi najpierw użyć do odczytu strun JSON przed użyciem metody JSON_NORMALATES (). Funkcja JSON_NORMALATE () odbędzie następnie ten obiekt JSON i zwróci wymagane dane w formie ramki danych.

Wraz z panami, zaimportowaliśmy również moduły JSON i JSON_NORMALALE, aby korzystać z dostarczanych przez nich funkcji i funkcji. Użyliśmy JSON.ładunki (), aby odczytać struny JSON. Obiekt pliku jest przekazywany JSON.load (), który zwraca obiekt JSON. Służy do odczytu danych, które zostały zakodowane z pliku, przekształcić je w słownik Python, a następnie deserializuj oryginalny plik. Wymagane dane zostały zawarte przez kluczowe „rec”, które są następnie przekazywane w funkcji JSON_NORMALATES (), aby spłaszczyć dane w Pandas DataFrame.

Wniosek

W tym samouczku omówiliśmy pliki danych JSON i sposób, w jaki możemy je odczytać za pomocą funkcji Read_Json (). Widzieliśmy składnię metody Read_Json (), aby zrozumieć, jak to działa. W tym artykule zaimplementowaliśmy kilka przykładów, aby nauczyć cię, jak odczytać plik JSON z lokalnej i zdalnej lokalizacji za pomocą funkcji Read_Json () oraz jak odczytać lub konwersji plik JSON i zagnieżdżoną strukturę JSON na Pandas za pomocą PD.Funkcja dataFrame () i JSON_NORMALATES ().