Data Science to dziedzina badań, która obsługuje ogromne ilości danych przy użyciu metod naukowych, procesów, algorytmów i systemów w celu znalezienia niewidzialnych wzorców, uzyskiwania znaczących informacji, podejmowania decyzji biznesowych w firm. Instytucje niezwiązane z biznesem obejmują branże opieki zdrowotnej, gier, rozpoznawanie obrazu, systemy rekomendacji, logistykę, wykrywanie oszustw (instytucje bankowe i finansowe), wyszukiwanie w Internecie, rozpoznawanie mowy, ukierunkowane reklamy, planowanie trasy linii lotniczych i rzeczywistość rozszerzona. Data Science to podgap sztucznej inteligencji. Dane wykorzystywane do analizy mogą pochodzić z wielu różnych źródeł i są prezentowane w różnych formatach. Niektóre dane źródłowe mogą być znormalizowane; Inne mogą nie być znormalizowane.
Mówiąc inaczej, do gromadzenia danych (liczba mnoga odniesienia) używane są różne metodologie (liczba mnoga punktu odniesienia). Następnie wiedza (cenne wnioski) wyodrębnia się z zmontowanych danych. W trakcie tego procesu po zebraniu danych przeprowadzane są na nich (dane) w celu uzyskania nowych danych (wyników), z których problemy są rozwiązywane.
Data Science jako (główna) dyscyplina istnieje na poziomie licencjackim i magisterskim na uniwersytecie. Jednak tylko kilka uniwersytetów na świecie oferuje nauki o danych na tytule licencjata lub magistra. Na poziomie licencjackim student ukończy studia z nauki o danych. To jest jak stopień ogólnego celu. Na poziomie magistra uczeń wychodzi z dyplomem podyplomowym z zakresu danych, specjalizujących się w analizie danych, inżynierii danych lub jako naukowca danych.
Może to zaskoczyć czytelnika i być może niestety, że uczenie maszynowe, modelowanie, statystyki, programowanie i bazy danych są niezbędną wiedzą do badania nauki danych na poziomie licencjackim, pomimo tego, że są szanowane kursy uniwersyteckie z własnych praw, badane, badane Inne dyscypliny na poziomie licencjata lub poziomu magistra. Niezależnie od tego, kiedy student udaje się na uniwersytet, aby studiować nauki o danych na poziomie, wszystkie te kursy będą nadal badane, obok właściwych kursów, w zakresie nauki o danych.
Data Science for Bachelor lub jego specjalizacje, takie jak analizy danych, inżynieria danych lub jako naukowca, są nadal opracowywane; Chociaż osiągnęli etap, który są stosowani w branżach po badaniu (na uniwersytecie). Ogólnie rzecz biorąc, danych jest stosunkowo bardzo nową dyscypliną.
Pamiętaj, że najpierw powinieneś być generalistą, zanim zostałby specjalistą. Rozróżnienia między programami specjalistami nie są jeszcze jasne. Rozróżnienia między programami generalistycznymi i specjalistycznymi nie są jeszcze jasne.
Ponieważ Data Science jest stosunkowo nową dyscypliną, książki określone w tym dokumencie oparte są na zasięgu treści, a nie pedagogice (How dobrze książka uczy). I są dla programu Bachelor's Degree (Generalist). Istnieją różne kursy ogólne.
Lista
Aby uzyskać więcej informacji i możliwy zakup z kartą kredytową, podano hiperłącze dla każdej z książek. Żadna z książek nie obejmuje wszystkich kursów ogólnych.
Niezbędna matematyka dla nauki danych: rachunek, statystyka, teoria prawdopodobieństwa i algebra liniowa
Napisane przez: Hadrien Jean
Treść tej książki może być postrzegana jako kurs matematyki dla nauki danych. Chociaż nie zaleca się nauki danych przez siebie, absolwent szkół średnich, który chce sam nauczyć się danych.
Treść: rachunek różniczkowy; Statystyki i prawdopodobieństwo; Algebra liniowa; Skalary i wektory; Macierze i tensory; Rozpiętość, zależność liniowa i transformacja przestrzeni; Układy równań liniowych; Wektory własne i wartości własne; Rozkład według wartości osobliwych.
https: // www.EssentialMathfordatasciience.com/
Wspólny rozsądny przewodnik po strukturach danych i algorytmach: Wyrównaj swoje podstawowe umiejętności programowania / wydanie 2
Napisane przez: Jay Wengrow
Ta książka dotyczy algorytmów i struktur danych, które są wykorzystywane w nauce danych. Zakładając, że ktoś sam uczy się nauki o danych po ukończeniu szkoły średniej, jest to kolejna książka do przeczytania po przeczytaniu poprzedniej książki matematycznej. Przykładowe programy podano w JavaScript, Python i Ruby.
Treść: dlaczego struktury danych mają znaczenie; Dlaczego algorytmy mają znaczenie; O tak! Wielka notacja; Przyspieszając kod Big O; Optymalizacja kodu z dużym O i bez; Optymalizacja optymistycznych scenariuszy; Big O w codziennym kodzie; Poleć szybkie wyszukiwanie ze stołami skrótów; Tworzenie eleganckiego kodu z stosami i kolejkami; Rekurencyjnie powtarzają się z rekurencją; Nauka pisania w rekurencyjnym; Programowanie dynamiczne; Algorytmy rekurencyjne dla prędkości; Struktury danych oparte na węzłach; Przyspieszając wszystkie rzeczy z drzewami binarnymi; Utrzymywanie priorytetów prosto z stosami; Trie nie boli; Łączenie wszystkiego z wykresami; Radzenie sobie z ograniczeniami przestrzeni; Techniki optymalizacji kodu
Mądrzejsze nauki o danych: odnoszenie sukcesu w projektach klasy korporacyjnej i projektów AI / 1St Wydanie
Napisane przez: Neal Fishman, Cole Stryker i Grady Booch
Treść: wspinanie się po drabinie AI; Ramowanie Część I: Rozważania dla organizacji korzystających z AI; Ramowanie Część II: Rozważania dotyczące pracy z danymi i AI; Spojrzenie na analizy: więcej niż jeden młot; Patrząc na analitykę: nie wszystko może być gwoździe; Zwracanie się do dyscyplin operacyjnych na drabinie AI; Maksymalizacja wykorzystania danych: oparta na wartości; Wycena danych za pomocą analizy statystycznej i umożliwianie znaczącego dostępu; Konstruowanie długoterminowej; Koniec podróży: IA dla AI.
Uczenie maszynowe: perspektywa probabilistyczna (seria obliczeń adaptacyjnych i uczenia maszynowego) ilustrowana edycja
Napisane przez: Kevin P. Murphy
Ta książka jest dobra dla początkujących. Ponownie, podobnie jak cała reszta książek określonych w tym dokumencie, ta książka nie obejmuje wszystkiego, co niezbędne dla programu ogólnego, które niestety wciąż nie są sfinalizowane (programy specjalistyczne również nie są sfinalizowane). Typowym początkującym tutaj jest absolwent szkoły średniej z podaniem matematyki i informatyki.
Treść: wprowadzenie (uczenie maszynowe: co i dlaczego?, Uczenie się bez nadzoru, niektóre podstawowe pojęcia w uczeniu maszynowym); Prawdopodobieństwo; Modele generatywne dla danych dyskretnych; Modele Gaussa; Statystyki bayesowskie; Statystyka częstotliwości; Regresja liniowa; Regresja logistyczna; Uogólnione modele liniowe i rodzina wykładnicza; Ukierunkowane modele graficzne (Bayes Nets); Modele mieszanki i algorytm EM; Utajone modele liniowe; Rzadkie modele liniowe; Jądra; Procesy Gaussa; Adaptacyjne modele funkcji podstawowych; Markov i ukryte modele Markowa; Modele przestrzeni stanu; Nieokreślone modele graficzne (losowe pola Markiv); Dokładne wnioskowanie dla modeli graficznych; Wnioskowanie wariacyjne; Więcej wnioskowania wariacyjnego; Wnioskowanie Monte Carlo; Wnioskowanie Monte Carlo (MCMC) Markov Chain; Grupowanie; Uczenie się struktury modelu graficznego; Uławne modele zmiennych dla danych dyskretnych; Głęboka nauka.
Data Science for Business: Co musisz wiedzieć o eksploracji danych i myśleniu analitycznym / 1. wydaniu
Napisane przez: Tom Fawcett i Foster Provost
Treść: myślenie analityczne; Problemy biznesowe i rozwiązania w zakresie danych; Wprowadzenie do modelowania predykcyjnego: od korelacji do nadzorowanej segmentacji; Dopasowanie modelu do danych; Nadmierne dopasowanie i jego unikanie; Podobieństwo, sąsiedzi i klastry; Myślenie analityczne decyzyjne I: Jaki jest dobry model?; Wizualizacja wydajności modelu; Dowody i prawdopodobieństwo; Reprezentujący i wydobywczy tekst; Myślenie analityczne II: w kierunku inżynierii analitycznej; Inne zadania i techniki nauki danych; Strategia danych i strategia biznesowa; Wniosek.
https: // www.Amazonka.COM/Data-Science-Business-Data-analityczne-DP/B08VL5K5ZX
Praktyczne statystyki dla naukowców danych: 50+ niezbędnych pojęć z wykorzystaniem R i Python / 2nd Edition
Napisane przez: Peter Bruce, Andrew Bruce i Peter Gedeck
Treść: Eksploracyjna analiza danych, rozkłady danych i próbkowanie, eksperymenty statystyczne i testowanie istotności, regresja i prognoza, klasyfikacja, statystyczne uczenie maszynowe, uczenie się bez nadzoru.
Księga Why: The New Science of Cause and Effect
Napisane przez: Judea Pearl, Dana Mackenzie
Podczas gdy wiele książek o naukach danych korzysta z branży czystej biznesowej do ilustracji, ta książka wykorzystuje przemysł medyczny i inne dyscypliny do ilustracji.
Treść: Wprowadzenie: Umysł nad danymi; Drabina przyczynowa; Od Buccaneers po świnki morskie: geneza wnioskowania przyczynowego; Od dowodów do przyczyn: Wielebny Bayes spotyka się z panem. Holmes; Zakłócające i dekonujące: lub zabijanie zmiennej czają się; Wypełniona dymem debata: oczyszczenie powietrza; Paradoksy mnóstwo!; Poza dostosowaniem: podbój interwencji mocowania; Alternotfactuals: Mining Worlds, które mogłyby być; Mediacja: poszukiwanie mechanizmu; Big Data, sztuczna inteligencja i duże pytania.
Zbuduj karierę w nauce danych
Napisane przez: Emily Robinson i Jacqueline Nolis
Treść: rozpoczęcie nauki o danych; Znalezienie pracy w nauce danych; Rozstrzyganie nauki o danych; Rosnąc w roli nauki danych.
https: // www.Manning.com/Books/Build-a-Career-in-Data-Science
Data Science for Dummies / 2nd Edition
Napisane przez: Lillian Pierson
Ta książka zakłada, że czytelnik ma już matematykę i programowanie wcześniej znoszonej wiedzy.
Treść: owijanie głowy wokół danych; Eksplorowanie rurociągów inżynierii danych i infrastruktury; Stosowanie informacji opartych na danych do biznesu i przemysłu; Uczenie maszynowe: uczenie się na podstawie danych z maszyną; Matematyka, prawdopodobieństwo i modelowanie statystyczne; Korzystanie z klastrowania do podziału danych; Modelowanie z instancjami; Budowanie modeli obsługujących urządzenia internetowe; Zgodnie z zasadami projektu wizualizacji danych; Za pomocą D3.JS do wizualizacji danych; Aplikacje internetowe do projektowania wizualizacji; Badanie najlepszych praktyk w projektowaniu pulpitu nawigacyjnego; Tworzenie map z danych przestrzennych; Korzystanie z Pythona do nauki o danych; Używanie open source R dla nauki o danych; Korzystanie z SQL w nauce danych; Robienie danych z Excel i Knime; Data Science w dziennikarstwie: przybijanie pięciu WS (i H); Zagłębianie się w nauki o danych środowiskowych; Data Science for Driving Wzrost w handlu elektronicznym; Wykorzystanie nauki o danych do opisania i przewidywania działalności przestępczej; Dziesięć fenomenalnych zasobów dla otwartych danych; Dziesięć bezpłatnych narzędzi i aplikacji naukowych.
Wydobycie masywnych zestawów danych / 3r & D Wydanie
Napisane przez: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman
Ta książka zakłada również, że czytelnik ma już matematykę i programowanie wcześniej wymyślonej wiedzy.
Treść: wydobycie danych; MapReduce i nowy stos oprogramowania; Algorytmy za pomocą MapReduce; Znalezienie podobnych elementów; Strumienie danych wydobywczych; Analiza łącza; Częste elementy przedmiotów; Grupowanie; Reklama w Internecie; Systemy rekomendacji; Wydobywanie wykresów sieci społecznościowej; Redukcja wymiarowości; Uczenie maszynowe na dużą skalę.
Wniosek
Rozróżnienia między programami specjalistami nie są jeszcze jasne. Rozróżnienia między programami generalistycznymi i specjalistycznymi również nie są jeszcze jasne. Jednak po przeczytaniu podanej listy książek czytelnik będzie w stanie lepiej docenić specjalne role analityka danych, inżynierii danych i naukowca danych, a następnie iść naprzód.