PostgreSQL Utwórz histogram za pomocą danych

PostgreSQL Utwórz histogram za pomocą danych

Podczas przetwarzania i analizy danych histogramy potwierdzają przedstawienie rozkładu częstotliwości i łatwego uzyskania informacji. Przyjrzymy się kilku różnym metodom uzyskiwania rozkładu częstotliwości w PostgreSQL. Aby zbudować histogram w PostgreSQL, możesz użyć różnych poleceń histogramu PostgreSQL. Wyjaśnimy każdemu osobno.

Początkowo upewnij się, że masz powłokę wiersza polecenia PostgreSQL i PGADMIN4 zainstalowane w systemie komputerowym. Teraz otwórz powłokę wiersza polecenia PostgreSQL, aby rozpocząć pracę nad histogramami. Natychmiast poprosi Cię o wprowadzenie nazwy serwera, nad którą chcesz pracować. Domyślnie wybrano serwer „LocalHost”. Jeśli nie wprowadzisz go podczas skakania do następnej opcji, będzie kontynuować domyślnie. Następnie zachęci cię do wprowadzenia nazwy bazy danych, numeru portu i nazwy użytkownika do pracy. Jeśli go nie podasz, będzie on kontynuowany z domyślnym. Jak można wyświetlić z obrazu dołączonego poniżej, będziemy pracować nad bazą danych „test”. W końcu wprowadź hasło dla konkretnego użytkownika i przygotuj się.

Przykład 01:

Musimy mieć niektóre tabele i dane w naszej bazie danych do pracy. Więc tworzyliśmy tabelę „produkt” w bazie danych „Test”, aby zapisać zapisy różnych sprzedaży produktów. Ta tabela zajmuje dwie kolumny. Jednym z nich jest „order_date”, aby zapisać datę, kiedy zamówienie zostało wykonane, a drugi to „p_sold”, aby zaoszczędzić całkowitą liczbę sprzedaży w określonym dniu. Wypróbuj poniższe zapytanie w skelce poleceń, aby utworzyć tę tabelę.

>> Utwórz produkt tabeli (data order_date, p_sold int);

W tej chwili stół jest pusty, więc musimy dodać do niej kilka rekordów. Więc wypróbuj poniższe polecenie wstaw w skorupce, aby to zrobić.

>> Wstaw do wartości produktu („2021-03-01”, 1250), („2021-04-02”, 555), („2021-06-03”, 500), („2021-05-04” , 1000), („2021-10-05”, 890), („2021-12-10”, 1000), („2021-01-06”, 345), („2021-11-07”, 467 ), („2021-02-08”, 1250), („2021-07-09”, 789);

Teraz możesz sprawdzić, czy tabela ma w niej dane za pomocą polecenia Select, jak cytowano poniżej.

>> Wybierz * z produktu;

Użycie podłogi i kosza:

Jeśli lubisz pojemniki histogramu PostgreSQL, aby zapewnić podobne okresy (10-20, 20-30, 30-40 itp.), Uruchom polecenie SQL poniżej. Szacujemy liczbę pojemników na podstawie poniższej instrukcji, dzieląc wartość sprzedaży według wielkości pojemnika histogramu, 10.

Takie podejście ma korzyść z dynamicznej zmiany pojemników w miarę dodawania, usuwania lub modyfikowania danych. Dodaje również dodatkowe pojemniki dla nowych danych i/lub usuwa pojemniki, jeśli ich liczba osiągnie zero. W rezultacie możesz wydajnie generować histogramy w PostgreSQL.

FLOOTOVER FLOOT (P_SOLD/10)*10 z podłogą (P_SOLD/100)*100 do zwiększenia rozmiaru pojemnika do 100.

Korzystanie z klauzuli:

Skonstruujesz rozkład częstotliwości przy użyciu deklaracji przypadków, gdy rozumiesz pojemniki histogramu, które mają być wygenerowane lub jak zmieniają się rozmiary pojemnika histogramu. W przypadku PostgreSQL poniżej znajduje się kolejne stwierdzenie histogramu:

>> Wybierz „100-300” jako cena_beten, liczba (p_sold) jako liczba z produktu, w którym P_Sold między 100 a 300 unia (wybierz „300-600” jako price_between, liczenie (p_sold) jako liczba z produktu, gdzie p_sold między 300 a 600 ) Union (wybierz „600-900” jako cena_between, hrabia (p_sold) jako liczba z produktu, gdzie p_sold między 600 a 900) (wybierz „900-1300” jako price_between, hrabia (p_sold) jako liczba z produktu, gdzie p_sold między 900 I 1300);

A wyjście pokazuje rozkład częstotliwości histogramu dla wartości całkowitego zakresu kolumny „p_sold” i liczby liczby. Ceny wahają się od 300-600 i 900-1300 ma łączną liczbę 4 osobno. Zakres sprzedaży 600-900 otrzymał 2 liczby, a zakres 100-300 otrzymał 0 liczby sprzedaży.

Przykład 02:

Rozważmy kolejny przykład ilustrujących histogramy w PostgreSQL. Stworzyliśmy tabelę „uczeń”, używając cytowanego poniższego polecenia w skorupce. Ta tabela będzie przechowywać informacje dotyczące studentów i liczby, które mają liczby, które mają.

>> Utwórz tabelę student (std_id int, fail_count int);

Tabela musi zawierać pewne dane. Dlatego wykonaliśmy wkładkę do polecenia, aby dodać dane w tabeli „uczeń” jako:

>> Wstaw do wartości studentów (111, 30), (112, 60), (113, 90), (114, 3), (115, 120), (116, 150), (117, 180), (118 , 210), (119, 5), (120, 300), (121, 380), (122, 470), (123, 530), (124, 9), (125, 550), (126, 50 ), (127, 40), (128, 8);

Teraz tabela została wypełniona ogromną ilością danych zgodnie z wyświetlonym wyjściem. Ma losowe wartości dla STD_ID i nieodprawy uczniów.

>> Wybierz * od studenta;

Kiedy próbujesz uruchomić proste zapytanie w celu zebrania całkowitej liczby niepowodzeń, które ma jeden uczeń, wówczas będziesz mieć poniżej wyświetlone dane wyjściowe. Dane wyjściowe pokazuje tylko osobną liczbę liczb niepowodzeń każdego ucznia raz z metody „liczba” zastosowanej w kolumnie „std_id”. To wygląda niezbyt satysfakcjonująco.

>> Wybierz fail_count, Count (STD_ID) z grupy studenckiej o 1 zamówienie o 1;

W tym przypadku ponownie użyjemy metody podłogi przez podobne okresy lub zakresy. Wykonaj więc poniżej wyświetlone zapytanie w powłoce poleceń. Zapytanie dzieli uczniów „porażkę” przez 100.00, a następnie stosuje funkcję podłogową, aby utworzyć kosz o rozmiar 100. Następnie podsumowuje całkowitą liczbę uczniów mieszkających w tym konkretnym zakresie.

Wniosek:

Możemy wygenerować histogram z PostgreSQL przy użyciu dowolnej z wymienionych wcześniej technik, zależnych od wymagań. Możesz zmienić wiadra histogramu na każdy zasięg, jaki chcesz; Jednolite odstępy nie są wymagane. W tym samouczku staraliśmy się wyjaśnić najlepsze przykłady, aby wyczyścić twoją koncepcję dotyczącą tworzenia histogramu w PostgreSQL. Mam nadzieję, że postępując zgodnie z dowolnym z tych przykładów, możesz wygodnie utworzyć histogram swoich danych w PostgreSQL.