Lista 10 najlepszych książek i opisów najlepszych danych naukowych dla generalisty

Data Science to dziedzina badań, która obsługuje ogromne ilości danych przy użyciu metod naukowych, procesów, algorytmów i systemów w celu znalezienia niewidzialnych wzorców, uzyskiwania znaczących informacji, podejmowania decyzji biznesowych w firm. Instytucje niezwiązane z biznesem obejmują branże opieki zdrowotnej, gier, rozpoznawanie obrazu, systemy rekomendacji, logistykę, wykrywanie oszustw (instytucje bankowe i finansowe), wyszukiwanie w Internecie, rozpoznawanie mowy, ukierunkowane reklamy, planowanie trasy linii lotniczych i rzeczywistość rozszerzona. Data Science to podgap sztucznej inteligencji. Dane wykorzystywane do analizy mogą pochodzić z wielu różnych źródeł i są prezentowane w różnych formatach. Niektóre dane źródłowe mogą być znormalizowane; Inne mogą nie być znormalizowane.

Mówiąc inaczej, do gromadzenia danych (liczba mnoga odniesienia) używane są różne metodologie (liczba mnoga punktu odniesienia). Następnie wiedza (cenne wnioski) wyodrębnia się z zmontowanych danych. W trakcie tego procesu po zebraniu danych przeprowadzane są na nich (dane) w celu uzyskania nowych danych (wyników), z których problemy są rozwiązywane.

Data Science jako (główna) dyscyplina istnieje na poziomie licencjackim i magisterskim na uniwersytecie. Jednak tylko kilka uniwersytetów na świecie oferuje nauki o danych na tytule licencjata lub magistra. Na poziomie licencjackim student ukończy studia z nauki o danych. To jest jak stopień ogólnego celu. Na poziomie magistra uczeń wychodzi z dyplomem podyplomowym z zakresu danych, specjalizujących się w analizie danych, inżynierii danych lub jako naukowca danych.

Może to zaskoczyć czytelnika i być może niestety, że uczenie maszynowe, modelowanie, statystyki, programowanie i bazy danych są niezbędną wiedzą do badania nauki danych na poziomie licencjackim, pomimo tego, że są szanowane kursy uniwersyteckie z własnych praw, badane, badane Inne dyscypliny na poziomie licencjata lub poziomu magistra. Niezależnie od tego, kiedy student udaje się na uniwersytet, aby studiować nauki o danych na poziomie, wszystkie te kursy będą nadal badane, obok właściwych kursów, w zakresie nauki o danych.

Data Science for Bachelor lub jego specjalizacje, takie jak analizy danych, inżynieria danych lub jako naukowca, są nadal opracowywane; Chociaż osiągnęli etap, który są stosowani w branżach po badaniu (na uniwersytecie). Ogólnie rzecz biorąc, danych jest stosunkowo bardzo nową dyscypliną.

Pamiętaj, że najpierw powinieneś być generalistą, zanim zostałby specjalistą. Rozróżnienia między programami specjalistami nie są jeszcze jasne. Rozróżnienia między programami generalistycznymi i specjalistycznymi nie są jeszcze jasne.

Ponieważ Data Science jest stosunkowo nową dyscypliną, książki określone w tym dokumencie oparte są na zasięgu treści, a nie pedagogice (How dobrze książka uczy). I są dla programu Bachelor's Degree (Generalist). Istnieją różne kursy ogólne.

Lista

Aby uzyskać więcej informacji i możliwy zakup z kartą kredytową, podano hiperłącze dla każdej z książek. Żadna z książek nie obejmuje wszystkich kursów ogólnych.

Niezbędna matematyka dla nauki danych: rachunek, statystyka, teoria prawdopodobieństwa i algebra liniowa

Napisane przez: Hadrien Jean

Wydawca: Hadrien Jean
Opublikowana data: po 30 września 2020
Język: angielski
NIE. stron: ponad 400

Treść tej książki może być postrzegana jako kurs matematyki dla nauki danych. Chociaż nie zaleca się nauki danych przez siebie, absolwent szkół średnich, który chce sam nauczyć się danych.

Treść: rachunek różniczkowy; Statystyki i prawdopodobieństwo; Algebra liniowa; Skalary i wektory; Macierze i tensory; Rozpiętość, zależność liniowa i transformacja przestrzeni; Układy równań liniowych; Wektory własne i wartości własne; Rozkład według wartości osobliwych.

https: // www.EssentialMathfordatasciience.com/

Wspólny rozsądny przewodnik po strukturach danych i algorytmach: Wyrównaj swoje podstawowe umiejętności programowania / wydanie 2

Napisane przez: Jay Wengrow

Wydawca: Pragmatyczna półka z książkami
Opublikowana data: 15 września 2020
Język: angielski
Wymiary: 7.5 x 1.25 x 9.25 cali
NIE. stron: 508

Ta książka dotyczy algorytmów i struktur danych, które są wykorzystywane w nauce danych. Zakładając, że ktoś sam uczy się nauki o danych po ukończeniu szkoły średniej, jest to kolejna książka do przeczytania po przeczytaniu poprzedniej książki matematycznej. Przykładowe programy podano w JavaScript, Python i Ruby.

Treść: dlaczego struktury danych mają znaczenie; Dlaczego algorytmy mają znaczenie; O tak! Wielka notacja; Przyspieszając kod Big O; Optymalizacja kodu z dużym O i bez; Optymalizacja optymistycznych scenariuszy; Big O w codziennym kodzie; Poleć szybkie wyszukiwanie ze stołami skrótów; Tworzenie eleganckiego kodu z stosami i kolejkami; Rekurencyjnie powtarzają się z rekurencją; Nauka pisania w rekurencyjnym; Programowanie dynamiczne; Algorytmy rekurencyjne dla prędkości; Struktury danych oparte na węzłach; Przyspieszając wszystkie rzeczy z drzewami binarnymi; Utrzymywanie priorytetów prosto z stosami; Trie nie boli; Łączenie wszystkiego z wykresami; Radzenie sobie z ograniczeniami przestrzeni; Techniki optymalizacji kodu

Mądrzejsze nauki o danych: odnoszenie sukcesu w projektach klasy korporacyjnej i projektów AI / 1^St Wydanie

Napisane przez: Neal Fishman, Cole Stryker i Grady Booch

Wydawca: Wiley
Opublikowana data: 14 kwietnia 2020
Język: angielski
NIE. stron: 286

Treść: wspinanie się po drabinie AI; Ramowanie Część I: Rozważania dla organizacji korzystających z AI; Ramowanie Część II: Rozważania dotyczące pracy z danymi i AI; Spojrzenie na analizy: więcej niż jeden młot; Patrząc na analitykę: nie wszystko może być gwoździe; Zwracanie się do dyscyplin operacyjnych na drabinie AI; Maksymalizacja wykorzystania danych: oparta na wartości; Wycena danych za pomocą analizy statystycznej i umożliwianie znaczącego dostępu; Konstruowanie długoterminowej; Koniec podróży: IA dla AI.

Uczenie maszynowe: perspektywa probabilistyczna (seria obliczeń adaptacyjnych i uczenia maszynowego) ilustrowana edycja

Napisane przez: Kevin P. Murphy

Wydawca: MIT Press
Opublikowana data: 24 sierpnia 2012
Język: angielski
Wymiary: 8.25 x 1.79 x 9.27 cali
NIE. stron: 1104

Ta książka jest dobra dla początkujących. Ponownie, podobnie jak cała reszta książek określonych w tym dokumencie, ta książka nie obejmuje wszystkiego, co niezbędne dla programu ogólnego, które niestety wciąż nie są sfinalizowane (programy specjalistyczne również nie są sfinalizowane). Typowym początkującym tutaj jest absolwent szkoły średniej z podaniem matematyki i informatyki.

Treść: wprowadzenie (uczenie maszynowe: co i dlaczego?, Uczenie się bez nadzoru, niektóre podstawowe pojęcia w uczeniu maszynowym); Prawdopodobieństwo; Modele generatywne dla danych dyskretnych; Modele Gaussa; Statystyki bayesowskie; Statystyka częstotliwości; Regresja liniowa; Regresja logistyczna; Uogólnione modele liniowe i rodzina wykładnicza; Ukierunkowane modele graficzne (Bayes Nets); Modele mieszanki i algorytm EM; Utajone modele liniowe; Rzadkie modele liniowe; Jądra; Procesy Gaussa; Adaptacyjne modele funkcji podstawowych; Markov i ukryte modele Markowa; Modele przestrzeni stanu; Nieokreślone modele graficzne (losowe pola Markiv); Dokładne wnioskowanie dla modeli graficznych; Wnioskowanie wariacyjne; Więcej wnioskowania wariacyjnego; Wnioskowanie Monte Carlo; Wnioskowanie Monte Carlo (MCMC) Markov Chain; Grupowanie; Uczenie się struktury modelu graficznego; Uławne modele zmiennych dla danych dyskretnych; Głęboka nauka.

Data Science for Business: Co musisz wiedzieć o eksploracji danych i myśleniu analitycznym / 1. wydaniu

Napisane przez: Tom Fawcett i Foster Provost

Wydawca: O'Reilly Media
Opublikowana data: 17 września 2013
Język: angielski
Wymiary: 7 x 0.9 x 9.19 cali
NIE. stron: 413

Treść: myślenie analityczne; Problemy biznesowe i rozwiązania w zakresie danych; Wprowadzenie do modelowania predykcyjnego: od korelacji do nadzorowanej segmentacji; Dopasowanie modelu do danych; Nadmierne dopasowanie i jego unikanie; Podobieństwo, sąsiedzi i klastry; Myślenie analityczne decyzyjne I: Jaki jest dobry model?; Wizualizacja wydajności modelu; Dowody i prawdopodobieństwo; Reprezentujący i wydobywczy tekst; Myślenie analityczne II: w kierunku inżynierii analitycznej; Inne zadania i techniki nauki danych; Strategia danych i strategia biznesowa; Wniosek.

https: // www.Amazonka.COM/Data-Science-Business-Data-analityczne-DP/B08VL5K5ZX

Praktyczne statystyki dla naukowców danych: 50+ niezbędnych pojęć z wykorzystaniem R i Python / 2nd Edition

Napisane przez: Peter Bruce, Andrew Bruce i Peter Gedeck

Wydawca: O'Reilly Media
Opublikowana data: 2 czerwca 2020
Język: angielski
Wymiary: 7 x 0.9 x 9.1 cale
NIE. stron: 368

Treść: Eksploracyjna analiza danych, rozkłady danych i próbkowanie, eksperymenty statystyczne i testowanie istotności, regresja i prognoza, klasyfikacja, statystyczne uczenie maszynowe, uczenie się bez nadzoru.

Księga Why: The New Science of Cause and Effect

Napisane przez: Judea Pearl, Dana Mackenzie

Wydawca: podstawowa książka
Opublikowana data: 15 maja 2018 r
Język: angielski
Wymiary: 6.3 x 1.4 x 9.4 cale
NIE. stron: 432

Podczas gdy wiele książek o naukach danych korzysta z branży czystej biznesowej do ilustracji, ta książka wykorzystuje przemysł medyczny i inne dyscypliny do ilustracji.

Treść: Wprowadzenie: Umysł nad danymi; Drabina przyczynowa; Od Buccaneers po świnki morskie: geneza wnioskowania przyczynowego; Od dowodów do przyczyn: Wielebny Bayes spotyka się z panem. Holmes; Zakłócające i dekonujące: lub zabijanie zmiennej czają się; Wypełniona dymem debata: oczyszczenie powietrza; Paradoksy mnóstwo!; Poza dostosowaniem: podbój interwencji mocowania; Alternotfactuals: Mining Worlds, które mogłyby być; Mediacja: poszukiwanie mechanizmu; Big Data, sztuczna inteligencja i duże pytania.

Zbuduj karierę w nauce danych

Napisane przez: Emily Robinson i Jacqueline Nolis

Wydawca: Manning
Opublikowana data: 24 marca 2020 r
Język: angielski
Wymiary: 7.38 x 0.8 x 9.25 cali
NIE. stron: 354

Treść: rozpoczęcie nauki o danych; Znalezienie pracy w nauce danych; Rozstrzyganie nauki o danych; Rosnąc w roli nauki danych.

https: // www.Manning.com/Books/Build-a-Career-in-Data-Science

Data Science for Dummies / 2nd Edition

Napisane przez: Lillian Pierson

Wydawca: dla manekinów
Opublikowana data: 6 marca 2017
Język angielski
Wymiary: 7.3 x 1 x 9 cali
NIE. stron: 384

Ta książka zakłada, że czytelnik ma już matematykę i programowanie wcześniej znoszonej wiedzy.

Treść: owijanie głowy wokół danych; Eksplorowanie rurociągów inżynierii danych i infrastruktury; Stosowanie informacji opartych na danych do biznesu i przemysłu; Uczenie maszynowe: uczenie się na podstawie danych z maszyną; Matematyka, prawdopodobieństwo i modelowanie statystyczne; Korzystanie z klastrowania do podziału danych; Modelowanie z instancjami; Budowanie modeli obsługujących urządzenia internetowe; Zgodnie z zasadami projektu wizualizacji danych; Za pomocą D3.JS do wizualizacji danych; Aplikacje internetowe do projektowania wizualizacji; Badanie najlepszych praktyk w projektowaniu pulpitu nawigacyjnego; Tworzenie map z danych przestrzennych; Korzystanie z Pythona do nauki o danych; Używanie open source R dla nauki o danych; Korzystanie z SQL w nauce danych; Robienie danych z Excel i Knime; Data Science w dziennikarstwie: przybijanie pięciu WS (i H); Zagłębianie się w nauki o danych środowiskowych; Data Science for Driving Wzrost w handlu elektronicznym; Wykorzystanie nauki o danych do opisania i przewidywania działalności przestępczej; Dziesięć fenomenalnych zasobów dla otwartych danych; Dziesięć bezpłatnych narzędzi i aplikacji naukowych.

Wydobycie masywnych zestawów danych / 3^{r & D} Wydanie

Napisane przez: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

Wydawca: Cambridge University Press
Opublikowana data: 13 lutego 2020 r
Język angielski
Wymiary: 7 x 1 x 9.75 cali
NIE. stron: 565

Ta książka zakłada również, że czytelnik ma już matematykę i programowanie wcześniej wymyślonej wiedzy.

Treść: wydobycie danych; MapReduce i nowy stos oprogramowania; Algorytmy za pomocą MapReduce; Znalezienie podobnych elementów; Strumienie danych wydobywczych; Analiza łącza; Częste elementy przedmiotów; Grupowanie; Reklama w Internecie; Systemy rekomendacji; Wydobywanie wykresów sieci społecznościowej; Redukcja wymiarowości; Uczenie maszynowe na dużą skalę.

Wniosek

Rozróżnienia między programami specjalistami nie są jeszcze jasne. Rozróżnienia między programami generalistycznymi i specjalistycznymi również nie są jeszcze jasne. Jednak po przeczytaniu podanej listy książek czytelnik będzie w stanie lepiej docenić specjalne role analityka danych, inżynierii danych i naukowca danych, a następnie iść naprzód.

Pyton

Python nie wszystkie argumenty przekonwertowane podczas formatowania ciągu

Ten błąd można naprawić, korygując składnię operatora %, przy użyciu funkcji format () zamiast opera...

Renata Borowiec

System systemu Windows

Jaka jest różnica między systemem Windows Top 10 a Pro

Wersja „pro” jest przeznaczona dla profesjonalnych użytkowników i ma więcej narzędzi administracyjny...

Igor Skrzypek

Doker

Jak definiowane są tomy w Docker Compose YAML?

Objętości są zdefiniowane przy użyciu klawisza „Volume” w pliku YAML Docker Compose. Użytkownicy mog...

Bruno Dobrowolski