Oświadczenia SQL dla naukowców danych

Oświadczenia SQL dla naukowców danych
SQL oznacza ustrukturyzowany język programowania. Jest to prosty język zapytania, który umożliwia zarządzanie danymi z bazy danych.

Baza danych to zbiór danych przechowywanych w systemie komputerowym. SQL jest jednym z najbardziej uniwersalnych języków programowania, który może wykonywać tysiące funkcji, w tym czytanie, pisanie i manipulowanie danymi.

Jest to standardowy język programowania do zarządzania relacyjnymi bazami danych i jest używany przez informatyków, analityków danych i naukowców danych na całym świecie.

W tym przewodniku przejdziemy przez instrukcje SQL lub zapytania, które są szeroko wykorzystywane w nauce danych.

W tym przewodniku wykorzystuje oprogramowanie PostgreSQL do uruchamiania zapytań. Możesz pobrać go z oficjalnej strony, klikając tutaj.

Biorąc to pod uwagę, zacznijmy!1

1. Wybieranie wszystkich kolumn

Instrukcja Select jest jednym z najbardziej fundamentalnych zapytań SQL. Ta instrukcja pomaga wybrać niektóre lub wszystkie kolumny z bazy danych. Będziesz korzystać z tej funkcji w projektach danych dotyczących danych.

Aby wybrać wszystkie kolumny, użyj „*”, jak pokazano w poniższym przykładzie:

„Produkt” to tabela składająca się z 3 kolumn. Po uruchomieniu poprzedniego zapytania możemy spojrzeć na kolumny obecne w tabeli produktów.

2. Z klauzuli

Z klauzuli pochodzi po wybraniu i pomaga określić, gdzie kolumna znajduje się w tabeli według nazwy.

Podczas określania wielu tabel użyj przecinków i przestrzeni między nazwami tabeli. Jest to pokazane w poniższym przykładzie:

Wyjście jest bardziej specyficzne z tylko jedną kolumną. Jest to pokazane następująco:

3. Gdzie klauzula

Następne stwierdzenie po tym, gdzie. Pomaga nam filtrować dane z bazy danych na podstawie określonych warunków.

Wyjście:

4. Grupa według stwierdzenia

Ta klauzula służy do wyboru i grupowania wierszy, które mają te same wartości.

W danym zapytaniu SQL będziemy grupować dwa rzędy, w których wartość Product_Price jest równa 6.

Wyjście będzie miało nową kolumnę o nazwie Count. Następnie następuje kolumna nazwy Product_name, jak pokazano następująco:

5. Mając stwierdzenie

Funkcje agregacji, takie jak suma, avg, max, min itp. nie można użyć w klauzuli Where. Aby ich użyć, musisz użyć instrukcji posiadania. Zostaje to pokazane za pomocą następującego kodu:

Wyjście:

6. Zamów według oświadczenia

Z nazwy, zamówienie według polecenia służy do wyświetlania rekordów w kolejności rosnącej lub zstępującej. W celu wznoszenia, użyj kolejności samodzielnie lub dodaj wzdłuż słowa kluczowego „ASC”. Podobnie, aby sortować wartości w kolejności malejącej, użyj słowa kluczowego „DESC” wraz z kolejnością.

W celu zejścia:

Wyjście:

Podobnie dla kolejności rosnącej:

Wyjście:

7. Oświadczenie o limicie

Limit jest ważną instrukcją SQL, która pomaga określić liczbę rekordów do zwrócenia z bazy danych. Na przykład, aby zwrócić tylko dwa wiersze z naszej bazy danych, użyj polecenia limitu w następujący sposób:

Wyjście:

8. Wstępnie zdefiniowane funkcje danych

Prefiniowane funkcje są bardzo ważne w SQL, ponieważ pomagają naukowcom danych zaoszczędzić czas. Funkcje te są również nazywane funkcjami agregatami, które działają na zbiorze wierszy zamiast jednego wiersza i zwracają jedną wartość. Istnieje wiele różnych funkcji kruszywa. Niektóre ważne są wymienione w następujący sposób:

Count (*) -> Zwraca liczbę wierszy.

Min () -> znajduje minimalną wartość w kolumnie.

Max () -> znajduje maksymalną wartość w kolumnie.

Sum () -> suma wszystkich wartości wewnątrz nazwy kolumny.

Jaka jest maksymalna cena w naszej tabeli danych?

Wyjście:

9. Wewnętrzne, lewe i prawe dołącza

Istnieje wiele rodzajów połączeń, ale trzy główne są omawiane tutaj.

Wewnętrzne połączenie jest najprostszym i najczęstszym połączeniem, który służy do utworzenia nowej tabeli, która ma pasujące rzędy w lewej i prawej kolumnie.

Wyjście:

Lewy połączenie zwraca wszystkie wiersze w lewej kolumnie i pasujące wiersze w prawej kolumnie.

Wyjście:

Tutaj dołączyliśmy do kolumny Product_Profit z tabeli 2 z kolumną nazwy produktu z tabeli 1.

Prawe połączenie jest przeciwieństwem lewego połączenia. Zwraca wszystkie wiersze obecne w prawej kolumnie i pasujące wiersze w lewej kolumnie.

10. Prequeries

Last, ale nie mniej. Jest zagnieżdżony w większym zapytaniu, które może wystąpić w klauzuli wybierania, z.

Podział nie ogranicza się do tych klauzul. Może również wystąpić w innych klauzulach, takich jak usuwanie, wstawienie lub aktualizacja.

Kolejną ważną cechą podziału jest to, że możesz użyć operatorów logicznych, takich jak>, <, or =. A subquery is also executed first before its parent query.

Na przykład:

Wyjście:

Wniosek

W tym artykule omówiliśmy ważne zapytania SQL dla naukowców danych. Te zapytania są bardzo powszechne i mogą być używane przez specjalistów, takich jak inżynierowie danych, analitycy danych itp. Najlepszym sposobem nauki wszystkich tych pytań jest stworzenie własnej bazy danych, a następnie ćwiczenie jak najwięcej. Dzięki temu przewodnikowi jako fundamencie możesz teraz dowiedzieć się o bardziej zaawansowanych zapytaniach dotyczących nauki o danych.