Big data

Denne visualisation af redigeringer på Wikipedia er skabt af IBM. Med en størrelse på adskillige terabytes er Wikipedias tekst og billeder et klassisk eksempel på big data.

Big data[1][2] er et begreb indenfor datalogi, der bredt dækker over indsamling, opbevaring,[3] analyse,[4] processering og fortolkning af enorme mængder af data. Som mange andre IT-ord har big data ingen dansk oversættelse.

Rammerne for big data har gennem årene rykket sig kraftigt. Man har således bevæget sig fra en opfattelse af gigabyte data som værende store datamængder, til at man i 2012 snakkede om petabyte og exabyte som store mængder.[5][6] Tendensen i retning af større datasæt har grundlag i muligheden for at trække supplerende information fra analyse af et enkelt sæt af stor mængde sammenhængende data, i sammenligning med adskilte, mindre sæt med den samme totale mængde data, der giver mulighed for at finde sammenhænge så man kan "spotte forretningstrends, fastslå forskningskvalitet, forebygge sygdomme, sammenholde juridiske citater, bekæmpe kriminalitet og holde øje med trafikforhold i realtid."[7][8]

Videnskabsmænd møder ofte begrænsninger som følge af store datasæt; sådanne områder kan inkludere meteorologi, genetik,[9] komplekse fysiske simulationer[10] og biologisk og miljømæssig forskning.[11]

I 2012 produceredes der på internettet enorme mængder af data, for eksempel via sociale tjenester som Facebook og Flickr.

Big data produceres ofte i real-tid, af f.eks. GPS-enheder og digitale sensorer som er indlejret i biler, sygehusudstyr mm. Man kan også have big data, som man ikke selv har en kopi af, men blot adgang til via API'er.

  1. ^ White, Tom (10. maj 2012). Hadoop: The Definitive Guide. O'Reilly Media. s. 3. ISBN 978-1-4493-3877-0. (engelsk)
  2. ^ "MIKE2.0, Big Data Definition". Arkiveret fra originalen 25. september 2018. Hentet 22. december 2012. (engelsk)
  3. ^ Kusnetzky, Dan. "What is "Big Data?"". ZDNet. Arkiveret fra originalen 21. februar 2010. Hentet 22. december 2012. (engelsk)
  4. ^ Vance, Ashley (22. april 2010). "Start-Up Goes After Big Data With Hadoop Helper". New York Times Blog. (engelsk)
  5. ^ Francis, Matthew (2012-04-02). "Future telescope array drives development of exabyte processing". Hentet 2012-10-24. (engelsk)
  6. ^ Watters, Audrey (2010). "The Age of Exabytes: Tools and Approaches for Managing Big Data". Hewlett-Packard Development Company. Arkiveret fra originalen (Website/Slideshare) 16. marts 2013. Hentet 2012-10-24. (engelsk)
  7. ^ "E-Discovery Special Report: The Rising Tide of Nonlinear Review". Hudson Global. Arkiveret fra originalen 3. juli 2012. Hentet 1. juli 2012. by Cat Casey and Alejandra Perez (engelsk)
  8. ^ "What Technology-Assisted Electronic Discovery Teaches Us About The Role Of Humans In Technology — Re-Humanizing Technology-Assisted Review". Forbes. Hentet 1. juli 2012. (engelsk)
  9. ^ "Community cleverness required". Nature. 455 (7209): 1. 4. september 2008. doi:10.1038/455001a. (engelsk)
  10. ^ "Sandia sees data management challenges spiral". HPC Projects. 4. august 2009. Arkiveret fra originalen 3. april 2016. Hentet 22. december 2012. (engelsk)
  11. ^ Reichman, O.J.; Jones, M.B.; Schildhauer, M.P. (2011). "Challenges and Opportunities of Open Data in Ecology". Science. 331 (6018): 703-5. doi:10.1126/science.1197962. (engelsk)

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Tubidy