Co je to datová věda?
V oblasti datové vědy je řešení problémů a zodpovídání otázek pomocí analýzy dat běžnou praxí. Datoví vědci často vytvářejí model pro předpovídání výsledků nebo odhalování základních vzorců s cílem získat lepší poznatky.
Organizace mohou tyto poznatky využít k jednání a zlepšení budoucích výsledků. Existuje řada rychle se rozvíjejících technologií, které pomáhají analyzovat data a vytvářet modely. V pozoruhodně krátké době došlo k rychlému pokroku od stolních počítačů k hostování masivních paralelních skladů s obrovskými objemy dat; dochází tak k citelné transformaci od analytických funkcí v databázi v relačních databázích k nástrojům pro nestrukturovaná velká data.
Analýza nestrukturovaných nebo polostrukturovaných dat je stále důležitější pro začlenění sentimentu a dalších užitečných informací zapsaných v přirozeném jazyce do prediktivních modelů; to často vede k výraznému zlepšení kvality a přesnosti modelu.
Nové analytické přístupy usilují o automatizaci kroků při vytváření a aplikaci modelů, což z technologie strojového učení (ML) činí nezbytný vývoj směrem k moderní datové vědě.
Úspěšné projekty ML vyžadují kombinaci algoritmů + dat + týmu a velmi výkonné výpočetní infrastruktury.
Datový vědec patří mezi tři nejvýznamnější nově vznikající profese
Ačkoli datová věda jako obor existuje již několik desetiletí, rychlý rozvoj umělé inteligence (AI) v podnikání v posledních pěti letech vyvolal poptávku po datových vědcích, která dalece převyšuje dostupnost vyškolených odborníků. V současné době 63 % vedoucích pracovníků uvádí nedostatek talentů jako hlavní překážku pro zavádění technologií AI[1]. Tento nedostatek talentů je příležitostí pro začínající odborníky a výzvou pro společnosti usilující o konkurenční výhodu na trhu.
Podle zprávy LinkedIn Emerging Jobs[2] se v roce 2020 datový vědec již tři roky po sobě umístil na prvním místě žebříčku "Emerging Jobs" a předpokládá se, že jeho roční růst bude činit 37 %. Jedná se o specializaci, která nadále výrazně roste napříč všemi odvětvími, což se připisuje vývoji dříve existujících pracovních pozic a zvýšenému důrazu na data v akademickém výzkumu.
Jaké dovednosti potřebuje datový vědec, aby byl úspěšný?
Datová věda je mezioborový soubor dovedností na pomezí statistiky, počítačového programování a odborných znalostí v dané oblasti. Zahrnuje tři odlišné a překrývající se oblasti:
- Statistika, modelování a shrnutí souborů dat.
- informatika, navrhování a používání algoritmů pro ukládání, zpracování a vizualizaci dat.
- Odborné znalosti v dané oblasti, které jsou nezbytné pro formulaci správných otázek a zasazení odpovědí do kontextu.
- Dalšími často opomíjenými dovednostmi jsou:
- Vedení
- Týmová práce
- Komunikace