Podatkovna znanost - kaj je to, opredelitev in koncept

Kazalo:

Anonim

Podatkovna znanost je disciplina, ki preučuje, od kod izvira določena informacijska baza. Obravnava tudi, kako si je mogoče te vire razlagati in predstavljati za produktivno uporabo.

Se pravi, znanost o podatkih je tista, ki je povezana z upravljanjem baz podatkov, shranjenih v digitalnih datotekah, iz katerih je mogoče uporabiti veliko koristnih informacij kot statistične kazalnike. Ti lahko na primer podjetju pomagajo pri sprejemanju poslovnih odločitev.

Podatkovna znanost prav tako ponuja orodja, ki omogočajo ne samo interpretacijo, temveč tudi predstavitev razpoložljivih podatkov, na primer na slikah. Tako imamo med drugim histogram, stolpčni diagram, tortni diagram.

Kot je razbrati, je ta veda interdisciplinarna, saj zajema predvsem znanje matematike, statistike in računalništva.

Znanost o podatkih in tipi podatkov

Prav tako je treba opozoriti, da znanost o podatkih lahko deluje z dvema vrstama podatkov:

  • Strukturirano: To so tiste, ki so organizirane, na primer tiste tabele z različnimi stolpci, vsaka z različno kategorijo, kot so: ime, priimek, starost, številka osebnega dokumenta itd.
  • Nestrukturirano: Tisti, ki ne ustrezajo določeni obliki, na primer prosto napisano besedilo. V tem primeru morate razlagati vsebino in izvleči podatke, s katerimi je mogoče upravljati.

Ob upoštevanju vsega, kar je bilo pojasnjeno, morajo strokovnjaki, specializirani za podatkovne vede, imeti ne samo analitične sposobnosti, temveč morajo biti sposobni sporočiti vsebino informacij, ki so jih obdelali.

Pomen znanosti o podatkih

Podatkovna znanost je pomembna za podjetja ali ustanove, ki morajo delati z veliko količino podatkov. Tako lahko to postane dragocena informacija.

Znanost o podatkih lahko povežemo z velikimi podatki, ki jih sestavljajo mehanizmi za obdelavo in upravljanje obsežnih podatkov, ki prihajajo iz različnih virov. Cilj je pretvoriti jih v informacije, ki jih lahko razlaga človek in ki mu pomagajo pri odločanju.

Ti podatki, ki jih je treba obdelati, lahko izvirajo iz transakcij med posamezniki in organizacijami (kot so bančni posli), vsakodnevnih dejanj ljudi (na primer iskanja po internetu), strojev (kot je GPS mobilnega telefona, ki beleži, kje je bil uporabnik) ali informacij biometrični (na primer prstni odtis).

Zgodovina znanosti o podatkih

Lahko rečemo, da je ameriški statistik John Wilder Tukey pionir znanosti o podatkih v šestdesetih letih prejšnjega stoletja in poudaril pomen analize podatkov namesto testiranja statističnih modelov.

Vendar pa je bil šele leta 1996 v naslovu predavanja prvič uporabljen izraz znanost o podatkih v predavanju z naslovom "Podatkovna znanost, klasifikacija in sorodne metode." To v okviru srečanja članov „Mednarodne zveze klasifikacijskih društev“ (IFCS) v Kobeju na Japonskem.

Drug pomemben mejnik je bil leta 2005, ko je Nacionalni odbor za znanost objavil "Dolgo živele zbirke digitalnih podatkov, ki omogočajo raziskave in izobraževanje v 21. stoletju". V tem dokumentu so podatkovni znanstveniki opredeljeni kot računalniški strokovnjaki, programerji baz podatkov in programske opreme ter strokovnjaki iz drugih strok (na primer knjižničarji in arhivisti), ki so ključnega pomena za uspešno upravljanje digitalne zbirke podatkov.

Vendar je to še vedno študijsko področje, ki se še razvija.