MongoDB Znajdź duplikaty

MongoDB Znajdź duplikaty
„Czy kiedykolwiek słyszałeś o koncepcji duplikacji danych podczas pracy w bazach danych? Kiedy rekord, rzecz, osoba lub miejsce ma dokładną kopię, ta kopia jest mówi się, że jest duplikatem oryginału. Pracując w tradycyjnych bazach danych, używamy klauzuli Where, aby znaleźć duplikaty w rekordach tabeli, i.mi., SQL, PostgreSQL. Z drugiej strony MongoDB nie pozwala korzystać z klauzuli Where, aby znaleźć duplikaty wstawione do kolekcji określonej bazy danych.

Wymyśliło funkcję zagregowaną, aby znaleźć duplikaty wartości z kolekcji. W ramach tego artykułu będziemy omawiać wstawienie duplikatów rekordów w kolekcjach Mongo DB i wyświetli je na powładzie MongoDB przy użyciu agregowanego polecenia kolekcji. Zacznijmy od naszego dzisiejszego artykułu, używając instrukcji aktualizacji APT i aktualizacji w terminalu powłoki Ubuntu 20.04 System. W tym celu musisz najpierw zalogować się i otworzyć powłokę za pomocą „Ctrl+alt+t.„Następnie możesz wypróbować instrukcję pokazywania się w powładzie i dodać hasło dla użytkownika, aby kontynuować proces aktualizacji."

Może to wymagać potwierdzenia, aby kontynuować ten proces. Stuknij „Y”, zapytając: „Czy chcesz kontynuować?". Następnie naciśnij klawisz Enter.

Przetwarzanie według sytuacji systemu może zająć mniej więcej czasu.

Po pełnej aktualizacji otrzymasz ostatnie linie przetwarzania Phise.

Po udanej aktualizacji systemu i aktualizacji musimy otworzyć powłokę MongoDB, aby wstawić niektóre kolekcje i rekordy w bazie danych. Więc używamy do tego zapytania „Mongo”, jak pokazano na obrazie. Skorupa została pomyślnie przygotowana.

Korzystając z instrukcji „DB” w MongoDB Shell, odkryliśmy, że do naszego użycia dostępna jest baza danych „testowych”.

Dlatego używamy bazy danych „testowych” do dalszych zapytań i tworzenia w niej kolekcji. W tym celu wypróbuj instrukcję „Użyj”, po której następuje nazwa bazy danych, i.mi., "test."

Aby dodać rekordy, potrzebujemy kolekcji w testowej bazie danych. Dlatego musimy stworzyć nową kolekcję. W tym celu musimy wypróbować instrukcję „DB” wraz z funkcją MongoDB „CreateCollection ()”, a następnie nazwy nowej kolekcji w jej nawiasie, i.mi., Dane. Zapytanie zakończyło się powodzeniem, a kolekcja została pomyślnie utworzona zgodnie ze statusem „OK: 1”. Ponadto MongoDB, zwykle korzystamy z funkcji Find () poprzedzonej nazwą kolekcji, aby wyświetlić rekordy określonej kolekcji. Dlatego wypróbowaliśmy instrukcję „DB”, a następnie nazwę kolekcji, i.mi., Dane i funkcja FINK (), aby to zrobić. Zbiór „Dane” jest teraz puste. Dlatego musimy dodać do kolekcji niektóre rekordy.

Aby wstawić rekordy w gromadzeniu danych MongoDB, musimy wypróbować funkcję Insert () w instrukcji „DB” wraz z danymi w formie dokumentów, i.mi., Format listy. Używamy w sumie 4 kolumn do danych dokumentów z kolekcji, i.mi., _id, tytuł, wiek i cena. Dodaliśmy w sumie 5 rekordów dla wszystkich tych 4 kolumn gromadzenia danych.

Rekord został pomyślnie dodany zgodnie z powyższym wyjściem pokazuje liczbę rekordów 5 dla opcji „Ninserted”. Następnie będziemy używać funkcji FINK () z kolekcją „danych”, aby znaleźć i wyświetlić wszystkie rekordy tego kolekcji. Nie przekazujemy żadnych argumentów do nawiasu funkcji Find (), aby nie ograniczać rekordów kolekcji. Wszystkie 5 rekordów gromadzenia danych zostało przedstawionych w Mongo DB Shell.

Ponieważ mamy do czynienia z tematem znalezienia duplikatów w zbiorach MongoDB, musimy mieć również zduplikowane rekordy również w kolekcjach. Dlatego wkładaliśmy trzy kolejne rekordy w gromadzeniu danych, które mają być używane jako duplikaty niektórych już włożonych rekordów. Musimy zaktualizować kolumnę „_id” tylko, ponieważ identyfikator dowolnej kolumny musi być unikalny w MongoDB, tak jak kiedyś w tradycyjnych bazach danych. Ta sama funkcja wstawki została do tej pory używana z nazwą kolekcji „danych”. Dodano wszystkie trzy rekordy.

Teraz, kiedy uruchamiasz instrukcję „DB” z nazwą kolekcji „Dane”, a następnie funkcja Find (. W tym zbiórku możemy zobaczyć duplikaty kolumn innych niż „_id”.

Czas wypróbować metodę agregate () dla kolekcji „danych”, aby wymienić określone wartości kolumny, które są w niej powielane. Musisz użyć składni Pheld-Beelow Command w MongoDB. Opcja „$ grupa” służy do dodania wszystkich zduplikowanych wartości określonej kolumny w jednej, a opcja $ mecz zostanie wykorzystana do znalezienia grup o więcej niż 1 dokumencie. Z drugiej strony opcja „$ Project” zostanie użyta do określenia formatu wyświetlania zduplikowanych rekordów. Pierwsze pole opcji „$ grupa” określi nazwę kolumny, w której będziemy szukać duplikatów. Znaleziono w sumie 3 rekordy dla kolumny „tytuł” ​​kolekcji danych. Następnie to samo zapytanie zostało wypróbowane dla kolumny „wiek” i ponownie uzyskało 3 wyniki.

Wniosek

Wyjaśnienie duplikatów zapisów zostało podane we wstępnym akapicie i omówiliśmy różnicę między znalezieniem duplikatów z tradycyjnych baz danych a MongoDB. W tym celu staraliśmy się podać ilustrację o tworzeniu nowej kolekcji w MongoDB i wstawieniu w nim rekordów. Ponadto omówiliśmy zastosowanie funkcji łącznej, aby znaleźć określoną kolumnę zawierającą duplikat wartości w zbiorach. W tym artykule pokazano wyraźną różnicę w znalezieniu duplikatów dla MongoDB jako porównania z każdą inną bazą danych.