Data science

Data science neboli datová věda je interdisciplinární obor, který využívá vědecké metody, procesy, algoritmy a systémy pro získávání znalostí a poznatků z dat v různých podobách, jak strukturovaných, tak nestrukturovaných[1][2] podobně jako data mining.

Data science "sjednocuje statistiku, analýzu dat, strojové učení a související metody" s cílem "pochopit a analyzovat skutečné jevy" na základě dat.[3] Využívá techniky a teorie čerpané z mnoha oblastí matematiky, statistiky, informatiky a matematické informatiky.

Nositel Turingovy ceny Jim Gray si data science představoval jako „čtvrté paradigma“ vědy (empirické, teoretické, výpočetní a nyní založené na datech) a tvrdil, že „všechno ve vědě se mění v důsledku vlivu informačních technologií“ a záplavy dat.[4][5]

V roce 2012, kdy Harvard Business Review nazval data science "nejvíce sexy zaměstnáním 21. století"[6] se tento termín stal módním slovem. To je nyní často používáno zaměnitelně se staršími pojmy jako business analytics,[7] business intelligence, prediktivní modelování, data mining a statistika. Dokonce i myšlenka, že datová věda je sexy, parafrázuje Hanse Roslinga, který v dokumentu BBC 2011[8] prohlásil: "Statistika je nyní nejvíce sexy téma, které tu máme."[9] Nate Silver označil datovou vědu za sexy termín pro statistiku.[10] V mnoha případech jsou nyní dřívější přístupy a řešení jednoduše přejmenovávány jako data science, aby byly atraktivnější, což může způsobit, že termín se "zředí [...] za hranici užitečnosti".[11] I když mnohé univerzitní programy nyní nabízejí titul v oboru datové vědy, neexistuje konsensus o její definici nebo o obsahu učebních osnov.[7] K diskreditaci data science přispívá mnoho projektů v oblasti datové vědy a velkých dat, které nedokázaly poskytnout užitečné výsledky, často v důsledku špatného řízení a využívání zdrojů.[12][13][14][15]

  1. DHAR, V. Data science and prediction. Communications of the ACM. 2013, s. 64. Dostupné online. DOI 10.1145/2500499. 
  2. Archivovaná kopie [online]. [cit. 2019-01-17]. Dostupné v archivu pořízeném dne 2014-01-02. 
  3. [s.l.]: [s.n.] Dostupné online. ISBN 9784431702085. DOI 10.1007/978-4-431-65950-1_3. 
  4. Stewart Tansley; KRISTIN MICHELE TOLLE. The Fourth Paradigm: Data-intensive Scientific Discovery. [s.l.]: Microsoft Research, 2009. Dostupné online. ISBN 978-0-9825442-0-4. 
  5. BELL, G.; HEY, T.; SZALAY, A. COMPUTER SCIENCE: Beyond the Data Deluge. Science. 2009, s. 1297–1298. ISSN 0036-8075. DOI 10.1126/science.1170411. 
  6. DAVENPORT, Thomas H.; PATIL, DJ. Data Scientist: The Sexiest Job of the 21st Century. [s.l.]: Harvard Business Review, Oct 2012. Dostupné online. 
  7. a b Data Science: What's The Half-Life Of A Buzzword? [online]. [cit. 2022-04-16]. Dostupné online. 
  8. BBC Four - The Joy of Stats. BBC [online]. [cit. 2022-04-16]. Dostupné online. (anglicky) 
  9. SINGER, Natasha. When the Data Struts Its Stuff. www.nytimes.com. 2011-04-02. Dostupné online [cit. 2018-09-01]. (anglicky) 
  10. Archivovaná kopie [online]. [cit. 2019-01-17]. Dostupné v archivu. 
  11. Archivovaná kopie. radar.oreilly.com. Dostupné v archivu pořízeném dne 2019-02-01. 
  12. REDMAN, Thomas C. Are You Setting Your Data Scientists Up to Fail?. Harvard Business Review. 2018-01-25. Dostupné online [cit. 2022-04-16]. ISSN 0017-8012. 
  13. 70% of Big Data projects in UK fail to realise full potential. www.consultancy.uk [online]. 2018-04-30 [cit. 2022-04-16]. Dostupné online. (anglicky) 
  14. The Data Economy: Why do so many analytics projects fail? – Analytics Magazine. Analytics Magazine. 2014-07-07. Dostupné online [cit. 2018-05-26]. (anglicky) 
  15. Data Science: 4 Reasons Why Most Are Failing to Deliver [online]. [cit. 2022-04-16]. Dostupné online. (anglicky) [nedostupný zdroj]

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Tubidy