DATAcademy

Data Science na przestrzeni lat

Historia terminu ,,Data Science” sięga wczesnych latach 60 XX wieku. Pojawiło się zapotrzebowanie na specjalistów, którzy są w stanie przetwarzać duże ilości danych i je interpretować. Początkowo pracowano na bieżących danych, następnie zaczęto zlecać gromadzenie nowych.

Data Science wciąż ewoluuje i łączy różne dziedziny nauki takie jak informatyka, statystyka czy ekonometria. Dzięki Data Science nie tylko możemy analizować co jest tu i teraz, analiza danych pozwala nam na prognozowanie przyszłości. Czym dokładnie jest Data Science dowiesz się pod tym linkiem

Historia Data Science związana jest ze statystyką i wykorzystywaniem modeli statystycznych. Na przestrzeni lat zaczęto wykorzystywać uczenie maszynowe, sztuczną inteligencję, a także Internet.

Dane gromadzone za pośrednictwem Internetu to między innymi zachowania konsumenckie, dane demograficzne, trendy zakupowe, wejścia organiczne na stronę, skuteczności kampanii czy konwersje. Rozwój e-commerce dostarczył jeszcze więcej danych. Data Scientiści mierzą się z Big Data czyli z danymi, które spełniają zasadę 5V:

  1. Ogrome ilości (ang. Volume)
  2. Duża prędkość przyrostu danych (ang. Velocity)
  3. Duża różnorodność danych (ang. Variety)
  4. Wiarygodność danych (ang. Veracity)
  5. Wartość dla analiz (ang. Value)

Na początku, w 2001r zostały zdefiniowane pierwsze 3V a następnie dodane zostały 2 pozostałe V.

Rozwój na przykład medycyny czy też nauk społecznych, również sprawił, że wzrosło zapotrzebowanie na specjalistów Data Science. Dane, które zbierane są na potrzeby badań naukowych, są analizowane przez specjalistów, tak, aby zminimalizować ryzyko pojawienia się błędu (outsourcing).

Czym różni się statystyk od Data Scientista? Rola Data Scientista jest zwykle dużo szersza. Podczas gdy statystyk skupia się na części strice analitycznej tak Data Scientist musi godzić ze sobą kilka różnych obszarów.

Data Scientist doskonale rozumie architekturę oprogramowania, zna kilka języków programowania i wie jak je wykorzystać. Potrafi określić problem, zidentyfikować kluczowe źródła danych oraz w sposób wydajny te dane pozyskać. Dobry Data Scientist to często także osoba, która stanowi pomost pomiędzy zespołem technicznym a biznesem i jest w stanie w sposób efektywny komunikować z tymi zespołami.  

Na przestrzeni lat można nakreślić kilka ważnych dat dla branży Data Science.

W 1962 roku John Turkey napisał artykuł ,,The Future of Data Analysis”, w którym wspomniał o ewolucji statystyki. Miał on wątpliwości, kiedy do rozwiązania problemów matematycznych zaczęły być wykorzystywane komputery, a nie człowiek. To był naprawdę duży przeskok, jak na tamte lata.  Jednak w dalszej części artykułu przyznał, że szybko przekonał się do nowego sposobu, zainteresował się tematem i obszarem analizy danych.

Peter Naur (duński inżynier komputerowy) jako jeden z pierwszych zdefiniował Data Science w swojej książce Concise Survey of Computer Methods. “The science of dealing with data, once they have been established, while the relation of the data to what they represent is delegated to other fields and sciences.”

W 1974 roku w Concise Survey of Computer Methods (Peter Naur) wielokrotnie posłużył się terminem Data Science.

1977 Międzynarodowe Stowarzyszenie Informatyki Statystycznej określiło swoją misje jako “It is the mission of the IASC to link traditional statistical methodology, modern computer technology, and the knowledge of domain experts in order to convert data into information and knowledge.” czyli „Misją IASC jest łączenie tradycyjnej metodologii statystycznej, nowoczesnej technologii komputerowej i wiedzy ekspertów dziedzinowych w celu przekształcania danych w informacje i wiedzę”.

W 1989 roku powstały pierwsze warsztaty poświęcone Data Science organizowane przez obecne Special Interest Group on Knowledge Discovery and Data Mining.

1994 rok, Business Week opublikował artykuł, w którym poinformowano, iż firmy zaczęły gromadzić duże ilości danych osobowych w celach marketingowych.

1999 rok, to rok nacisku na narzędzia usprawniające prace na dużych bazach danych.

Ale to dopiero XXI wiek przyniósł największy i najszybszy rozwój Data Science

2001 rok- powstaje SaaS czyli Software-as-Service – prekursor korzystania z aplikacji opartych na chmurze. W tym samym roku William S. Cleveland zaprezentował plany szkolenia specjalistów zajmujących się analizą danych.

2002 rok- Międzynarodowa Rada Nauki: Komitet ds. Danych dla Nauki i Technologii rozpoczął publikację Data Science Journal.

W 2006 roku wypuszczono nierelacyjną, open-sourcową bazę danych Hadoop 0.1.0.

2008 rok, to rok, w którym specjalność Data Scientist oficjalnie zagościła w języku angielskim.

w 2009 roku główny ekonomista Google, Hal Varian, powiedział kwartalnikowi McKinsey, że jest zaniepokojony deficytem osób, które potrafią analizować dane.

W styczniu 2010 roku Apple wprowadził na rynek iPada, a w czerwcu tego samego roku  wypuścili swojego iPhone 4. Konsumenci zaczęli z entuzjazmem korzystać z technologii — w szczególności technologii mobilnej.

W lipcu 2010 Amazon opublikował komunikat prasowy, w którym poinformował, że po raz pierwszy sprzedał więcej książek cyfrowych Kindle, niż książek w twardej oprawie.

Rok 2011 to rok gdy odnotowano wzrost ofert pracy dla Data Scientistów o 15 000%!

W 2012 roku Data Scientist stał się najseksowniejszym zawodem XXI wieku.

2013 rok – IBM podaje, że 90% danych na świecie powstało w okresie lat 2011-2013. To pokazuje jak dużo danych zaczęliśmy produkować i jak duże zapotrzebowanie na Data Scientistów jest od tego czasu na rynku pracy.

2015 rok – poczyniony został ogromny rozwój deep learningu. Google voice odnotowało mega skok wydajności, aż o 49%.

2015 to przełomowy rok dla sztucznej inteligencji (AI). W ciągu roku, Google stworzyło ponad 2700 projektów wykorzystujących AI (wcześniej były to sporadyczne przypadki).

Jak widać historia Data Science jest stosunkowo świeża. Dziś wiemy jak ważna jest to nauka. Powstają kierunki studiów Analiza Danych/Data Science, kursy, bootcampy, książki. W swoich działaniach Data Scientiści wykorzystują automatykę, robotykę, uczenie maszynowe, rozpoznawanie mowy, wyszukiwarki internetowe, gospodarkę cyfrową i inne. Z pewnością jest to dziedzina, w której jeszcze wiele jest do udoskonalenia i rozwinięcia.

Serdecznie zachęcamy do nauki DS, analitycy są potrzebni niemal w każdej firmie, a zarobki, jakie można osiągnąć bywają zaskakujące. Coraz częściej Data Scientistami zostają ludzie z różnych środowisk (nie jest powiedziane, że musisz być powiązany z branżą IT). Liczą się predyspozycje, samozaparcie i praca włożona w naukę. Powodzenia!

Opracowanie głównie bazuje na:

A Brief History of Data Science

Inne źródła:

A Modern History of Data Science

Evolution of Data Science growth innovation

Leave a Comment

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *