La scienza dei dati è l'insieme di principi metodologici (basati sul metodo scientifico) e di tecniche multidisciplinari volto a interpretare ed estrarre conoscenza dai dati attraverso la relativa fase di analisi da parte di un esperto, chiamato scienziato dei dati (data scientist)[1][2].
I metodi della scienza dei dati (spesso associati al concetto di data mining) si basano su tecniche provenienti da varie discipline, principalmente da matematica, statistica, scienza dell'informazione, informatica e scienze sociali, in particolar modo nei seguenti sottodomini: basi di dati e visualizzazione dati o business intelligence, intelligenza artificiale o apprendimento automatico. Il ruolo di scienziato dei dati è stato definito dalla Harvard Business Review come «la professione più attraente del XXI secolo»[3] ed è considerato uno dei quattro ruoli chiave preposti all'utilizzo sistematico dei big data nelle aziende[4].