Przez ostatnie kilkadziesiąt lat, prawdopodobnie powstała podobna ilość definicji data science, co ilość mitów dotyczących tej dziedziny wiedzy. W czasach, w których dane stają się jednym z ważniejszych zasobów, lawinowo rośnie zapotrzebowanie na tych, którzy o zbiorach liczb, tekstów czy plików, potrafią opowiadać historie. A jeśli rośnie zapotrzebowanie na data scientistów, to bardzo szybko rosną też zarobki tych ekspertów. To z kolei implikuje zainteresowanie pracą w tym zawodzie.
 

Data Scientist jako najbardziej pożądany zawód XXI wieku


Niewielu autorom artykułów udało się rozpocząć aż taką dyskusję. Zawód Data Scientisty został znacząco spopularyzowany przez Harvard Business Review w roku 2012. W artykule: „Data Scientist: najseksowniejszy zawód XXI wieku” Thomas Davenport i D.J. Patil opisali fenomen zawodu naukowca danych. W tamtych czasach duże przedsiębiorstwa dopiero zaczynały dostrzegać znaczenie, jakie może mieć data science w uwalnianiu potęgi danych. W tamtym momencie zdefiniowano jeszcze jeden problem: ekspertów od danych jest mniej niż wynosi na nich zapotrzebowanie.
 

Naukowcy danych to nie tylko ludzie od liczb


Mogłoby się wydawać, że data scientist to człowiek spędzający głównie czas przed komputerem. Niezaprzeczalne jest, że taki naukowiec spędza sporo czasu przed ekranem, choćby czyszcząc dane (co zajmuje nawet 80% czasu osoby pracującej w data science). Wbrew różnym stereotypom, dobry naukowiec danych to też człowiek o wysoko rozwiniętych umiejętnościach komunikacyjnych. To dobry słuchacz – potrafi pytania biznesu przekuć w problem matematyczny. Data scientist to też mistrz w opowiadaniu historii – wszak rozwiązania problemów musi przetłumaczyć innym z języka matematycznego na język zrozumiały dla wszystkich.
 

Data science tak naprawdę łączy wiele dziedzin. Według najnowszych definicji, data science to interdyscyplinarna dziedzina która wykorzystuje między innymi statystykę, informatykę, analizę danych czy metody obliczeniowe. Nic więc dziwnego, że osób z takimi kwalifikacjami jest mniej niż rynek potrzebuje.
 

Jak to się jednak stało, że na rynku pracy pojawili się pierwsi data scientisci?
 

Data Science niejedno miało znaczenie


Zanim zaczęto myśleć o data science, pojawiła się statystyka, a jeszcze później analiza danych. Wcale nie tak dawno, w 1962 roku, John Tukey, wybitny amerykański statystyk (ten, któremu zawdzięczamy wykresy pudełkowe), opisał pewną dziedzinę, którą nazwał „analizą danych”.
 

Już kilkanaście lat później, pojawił się również termin „data science”, ale w zupełnie innym znaczeniu niż to, które znamy obecnie.  W 1974 roku Peter Naur, pochodzący z Danii pionier informatyki, zaproponował by pojęcia data science stosować jako alternatywną nazwę dla informatyki. Naur nie lubił terminu informatyka i w zamian zaproponował dwa terminy: datologia i data science.
 

Informatyka jednak została informatyką, a jedenaście lat później, w 1985 roku, podczas wykładu wygłoszonego w Chińskiej Akademii Nauk w Pekinie, CF Jeff Wu po raz pierwszy użył terminu „data science” jako alternatywnej nazwy statystyki. Później, w roku 1997 r., wygłosił on wykład inauguracyjny zatytułowany „Statystyka = Data Science?”. CF Jeff Wu spopularyzował termin „data science” i opowiadał się za zmianą nazwy statystyki na naukę o danych, a statystyków na naukowców zajmujących się danymi. Nie był w tym osamotniony, w tamtym czasie wielu ekspertów w dziedzinie danych postulowało, by terminu data science używać jako synonimu dla statystyki.
 

Dziś jednak statystyka dalej jest statystyką. A termin „data science” nabrał innego znaczenia. Współczesna koncepcja nauki o danych jako niezależnej dyscypliny jest czasami przypisywana Williamowi S. Clevelandowi. W artykule z 2001 roku opowiadał się za rozszerzeniem statystyki na obszary techniczne, łącząc matematyczną teorię z technologiami informatycznymi.
 

Ponad dwadzieścia lat później, wciąż jednak nie ma pełnej zgody co do definicji data science. Przez lata pojawiło się wiele interpretacji, ale też wiele nowych terminów. W ostatnich latach, równie często jak ze statystyką, data science wiązane jest z terminem „big data”. Patrząc więc na zmianę znaczeń w ostatnich pięćdziesięciu latach, nie jest wcale nieprawdopodobne, że za pięć lat definicja nauki o danych będzie brzmiała jeszcze inaczej.
 

Czy za pięć lat dalej będzie to jeden z najbardziej pożądanych zawodów? Patrząc na przyrastające zetta bajty danych oraz na rozwój sztucznej inteligencji w wielu branżach, nic nie zapowiada rychłego zniknięcia tych, którzy rozumieją sieci neuronowe czy działanie chatbotów. Nie wygląda też na to, żeby data scientistów miała zastąpić sztuczna inteligencja właśnie.