Bazy danych wykresów i ich przypadki użycia

Bazy danych wykresów i ich przypadki użycia
Aby sprostać wymaganiom naszego połączonego świata, w których ogromne ilości danych muszą być reprezentowane w czasie rzeczywistym oraz z błyskawicą i doskonałą wydajnością, w połowie lat 2000. pojawił się nowy rodzaj bazy danych.

Tradycyjne bazy danych to relacyjne bazy danych, które przechowują dane w rzędach i kolumnach i podkreślają możliwość denormalizacji danych i łączenia ich z klawiszami podstawowymi i obcymi. Jest to odpowiednie do tradycyjnych przypadków użycia, takich jak baza danych klienta i zamówienia do przechowywania i śledzenia klientów, zapasów, produktów i przedmiotów, które klient kupił.

Bazy danych wykresów rozwiązują inny problem, podkreślają relacje między danymi w dużych połączonych sieciach i pozwalają na przechowywanie, modelowanie i zapytanie tych nowych zestawów danych i przypadków użycia. Opiszemy kontekst i niektóre przykładowe przypadki użycia, w których baza danych wykresów jest bardziej odpowiedni niż relacyjna baza danych.

Jaka jest baza danych wykresów

Bazy danych wykresów zapewniają pierwsze podejście do przechowywania i zapytań danych. Przechowują dane w sposób logiczny, który reprezentuje rzeczywistą sieć i priorytetyzuje reprezentacje, zdolność do odkrycia i utrzymanie relacji danych.

Bazy danych wykresów używają struktur wykresów do zapytań semantycznych z węzłami, zwanymi wierzchołkami, krawędziami i właściwościami do reprezentowania danych i przechowywania danych.

  • Wierzchołek - reprezentuje rzeczywisty obiekt, taki jak film lub osoba.
  • Krawędź - reprezentuje związek między dwoma wierzchołkami.
  • Nieruchomości - podobne do pola w tablecie, ale bardziej elastyczne. Można zastosować na krawędź lub wierzchołek.

Bazy danych wykresów można zapytać za pomocą języków zorientowanych na wykresy, takich jak SparkQL, które są odpowiednie do wyrażania problemów w dużych domenach wykresu.

Najpopularniejsze bazy danych wykresów

Istnieją dziesiątki baz danych open source i komercyjnych wykresów, ale najczęstszą dostępną bazą danych wykresów jest zdecydowanie NEO4J, która jest bazą danych open source opisanych przez swoich programistów jako dostosowana do kwasu baza danych transakcyjnej z natywną przechowywaniem i przetwarzaniem wykresów.

Inne popularne bazy danych wykresów obejmują OrientDB (system zarządzania bazą danych NoSQL open source napisany w Javie), ArangODB (natywny system bazy danych wielomodelowych opracowany przez Triagens GmbH), MarkLogic (baza danych wielu modeli zaprojektowana dla prędkości i skali NOSQL) i Allegrograph (zamknięte źródło TripleStore, które jest zaprojektowane do przechowywania potrójnych RDF), żeby wymienić tylko kilka.

Przypadki użycia bazy danych wykresów

Bazy danych wykresów mają zastosowanie wszędzie, gdzie relacje danych są cenne w czasie rzeczywistym:

  • Portale społecznościowe - Być może najbardziej typowym przypadkiem użycia bazy danych wykresów są sieci społecznościowe, z złożonymi relacjami i aktywnością użytkownika.
  • Wykrywanie oszustw - Aby odkryć oszustwo w czasie rzeczywistym, niezbędna jest szybka analiza relacji danych, a bazy danych wykresów zapewniają niezbędną wydajność.
  • Wykresy wiedzy - Wykorzystane przez wyszukiwarki i firmy, wykresy wiedzy zbierają informacje z wielu różnych źródeł, umożliwiając lepsze zarządzanie zasobami cyfrowymi i łatwiejsze wyszukiwanie informacji.
  • Analiza sieci IT - Zarządzanie infrastrukturami sieciowymi i informatycznymi obraca się wokół złożonych współzależności, a bazy danych wykresów są z natury bardziej odpowiednie dla tego przypadku niż relacyjne bazy danych.
  • Zalecenia - Firmy mogą korzystać z baz danych wykresów do zasilania wyrafinowanych silników rekomendacyjnych do personalizacji produktów, treści i usług.
  • Zarządzanie tożsamością - Bazy danych wykresów umożliwiają wydajne śledzenie aktywności użytkownika oraz szybkie uporządki i zarządzanie zasobami.

Wniosek

Bazy danych wykresów rozwiązują dzisiejsze wyzwania danych, skupiając się nie tylko na danych, ale także na połączeniach między poszczególnymi wpisami bazy danych. Mają wiele przypadków użycia i są dostępne zarówno jako oprogramowanie oparte na społeczności, jak i oprogramowanie komercyjne z obsługą klasy korporacyjnej.