Baza danych to zbiór danych przechowywanych w systemie komputerowym. SQL jest jednym z najbardziej uniwersalnych języków programowania, który może wykonywać tysiące funkcji, w tym czytanie, pisanie i manipulowanie danymi.
Jest to standardowy język programowania do zarządzania relacyjnymi bazami danych i jest używany przez informatyków, analityków danych i naukowców danych na całym świecie.
W tym przewodniku przejdziemy przez instrukcje SQL lub zapytania, które są szeroko wykorzystywane w nauce danych.
W tym przewodniku wykorzystuje oprogramowanie PostgreSQL do uruchamiania zapytań. Możesz pobrać go z oficjalnej strony, klikając tutaj.
Biorąc to pod uwagę, zacznijmy!1
1. Wybieranie wszystkich kolumn
Instrukcja Select jest jednym z najbardziej fundamentalnych zapytań SQL. Ta instrukcja pomaga wybrać niektóre lub wszystkie kolumny z bazy danych. Będziesz korzystać z tej funkcji w projektach danych dotyczących danych.
Aby wybrać wszystkie kolumny, użyj „*”, jak pokazano w poniższym przykładzie:
„Produkt” to tabela składająca się z 3 kolumn. Po uruchomieniu poprzedniego zapytania możemy spojrzeć na kolumny obecne w tabeli produktów.
2. Z klauzuli
Z klauzuli pochodzi po wybraniu i pomaga określić, gdzie kolumna znajduje się w tabeli według nazwy.
Podczas określania wielu tabel użyj przecinków i przestrzeni między nazwami tabeli. Jest to pokazane w poniższym przykładzie:
Wyjście jest bardziej specyficzne z tylko jedną kolumną. Jest to pokazane następująco:
3. Gdzie klauzula
Następne stwierdzenie po tym, gdzie. Pomaga nam filtrować dane z bazy danych na podstawie określonych warunków.
Wyjście:
4. Grupa według stwierdzenia
Ta klauzula służy do wyboru i grupowania wierszy, które mają te same wartości.
W danym zapytaniu SQL będziemy grupować dwa rzędy, w których wartość Product_Price jest równa 6.
Wyjście będzie miało nową kolumnę o nazwie Count. Następnie następuje kolumna nazwy Product_name, jak pokazano następująco:
5. Mając stwierdzenie
Funkcje agregacji, takie jak suma, avg, max, min itp. nie można użyć w klauzuli Where. Aby ich użyć, musisz użyć instrukcji posiadania. Zostaje to pokazane za pomocą następującego kodu:
Wyjście:
6. Zamów według oświadczenia
Z nazwy, zamówienie według polecenia służy do wyświetlania rekordów w kolejności rosnącej lub zstępującej. W celu wznoszenia, użyj kolejności samodzielnie lub dodaj wzdłuż słowa kluczowego „ASC”. Podobnie, aby sortować wartości w kolejności malejącej, użyj słowa kluczowego „DESC” wraz z kolejnością.
W celu zejścia:
Wyjście:
Podobnie dla kolejności rosnącej:
Wyjście:
7. Oświadczenie o limicie
Limit jest ważną instrukcją SQL, która pomaga określić liczbę rekordów do zwrócenia z bazy danych. Na przykład, aby zwrócić tylko dwa wiersze z naszej bazy danych, użyj polecenia limitu w następujący sposób:
Wyjście:
8. Wstępnie zdefiniowane funkcje danych
Prefiniowane funkcje są bardzo ważne w SQL, ponieważ pomagają naukowcom danych zaoszczędzić czas. Funkcje te są również nazywane funkcjami agregatami, które działają na zbiorze wierszy zamiast jednego wiersza i zwracają jedną wartość. Istnieje wiele różnych funkcji kruszywa. Niektóre ważne są wymienione w następujący sposób:
Count (*) -> Zwraca liczbę wierszy.
Min () -> znajduje minimalną wartość w kolumnie.
Max () -> znajduje maksymalną wartość w kolumnie.
Sum () -> suma wszystkich wartości wewnątrz nazwy kolumny.
Jaka jest maksymalna cena w naszej tabeli danych?
Wyjście:
9. Wewnętrzne, lewe i prawe dołącza
Istnieje wiele rodzajów połączeń, ale trzy główne są omawiane tutaj.
Wewnętrzne połączenie jest najprostszym i najczęstszym połączeniem, który służy do utworzenia nowej tabeli, która ma pasujące rzędy w lewej i prawej kolumnie.
Wyjście:
Lewy połączenie zwraca wszystkie wiersze w lewej kolumnie i pasujące wiersze w prawej kolumnie.
Wyjście:
Tutaj dołączyliśmy do kolumny Product_Profit z tabeli 2 z kolumną nazwy produktu z tabeli 1.
Prawe połączenie jest przeciwieństwem lewego połączenia. Zwraca wszystkie wiersze obecne w prawej kolumnie i pasujące wiersze w lewej kolumnie.
10. Prequeries
Last, ale nie mniej. Jest zagnieżdżony w większym zapytaniu, które może wystąpić w klauzuli wybierania, z.
Podział nie ogranicza się do tych klauzul. Może również wystąpić w innych klauzulach, takich jak usuwanie, wstawienie lub aktualizacja.
Kolejną ważną cechą podziału jest to, że możesz użyć operatorów logicznych, takich jak>, <, or =. A subquery is also executed first before its parent query.
Na przykład:
Wyjście:
Wniosek
W tym artykule omówiliśmy ważne zapytania SQL dla naukowców danych. Te zapytania są bardzo powszechne i mogą być używane przez specjalistów, takich jak inżynierowie danych, analitycy danych itp. Najlepszym sposobem nauki wszystkich tych pytań jest stworzenie własnej bazy danych, a następnie ćwiczenie jak najwięcej. Dzięki temu przewodnikowi jako fundamencie możesz teraz dowiedzieć się o bardziej zaawansowanych zapytaniach dotyczących nauki o danych.