Ano ang Data science
Sa domain ng Data Science, ang paglutas ng mga problema at pagsagot sa mga tanong sa pamamagitan ng pagsusuri ng data ay karaniwang kasanayan. Kadalasan, ang mga siyentipiko ng data ay bumubuo ng isang modelo upang mahulaan ang mga kinalabasan o matuklasan ang mga nakapailalim na pattern, na may layuning makakuha ng mas mahusay na mga pananaw.
Maaaring isama ng mga organisasyon ang mga pananaw na ito upang kumilos at mapabuti ang mga kinalabasan sa hinaharap. Mayroong maraming mga mabilis na umuunlad na teknolohiya upang makatulong na suriin ang data at bumuo ng mga modelo. Sa isang kahanga-hangang maikling panahon, nagkaroon ng mabilis na pag-unlad mula sa mga desktop hanggang sa pag-host ng malalaking parallel warehouse na may malaking dami ng data; Sa ganitong paraan, mayroong isang palpable transformation mula sa mga pag andar ng in database ng analytics sa mga relational database sa mga hindi nakabalangkas na malalaking tool ng data.
Ang analytics sa hindi nakabalangkas o semi nakabalangkas na data ay nagiging lalong mahalaga upang isama ang damdamin at iba pang kapaki pakinabang na impormasyon na nakasulat sa likas na wika sa mga modelo ng hula; Ito ay madalas na humahantong sa makabuluhang pagpapabuti sa kalidad ng modelo at katumpakan.
Ang mga umuusbong na diskarte sa analytics ay naghahangad na i automate ang mga hakbang sa pagbuo ng modelo at aplikasyon, na ginagawang teknolohiya ng pag aaral ng machine (ML) isang kinakailangang ebolusyon patungo sa modernong agham ng Data.
Ang matagumpay na mga proyekto ng ML ay nangangailangan ng isang kumbinasyon ng mga algorithm + data + team, at isang napakalakas na imprastraktura ng computing.
Data Scientist ranggo sa tatlong nangungunang umuusbong na trabaho
Kahit na ang Data science bilang isang patlang ay umiiral sa loob ng ilang dekada, ang mabilis na paglago ng artipisyal na katalinuhan (AI) sa negosyo sa huling limang taon ay nakabuo ng isang demand para sa mga siyentipiko ng data na malayo na lumampas sa pagkakaroon ng mga sinanay na propesyonal. Ngayon, 63% ng mga ehekutibo ang nagbabanggit ng kakulangan ng talento bilang pangunahing hadlang sa pag aampon ng teknolohiya ng AI[1]. Ang agwat ng talento na ito ay isang pagkakataon para sa mga naghahangad na propesyonal at isang hamon para sa mga kumpanya na nagsusumikap para sa isang mapagkumpitensya na kalamangan sa merkado.
Ayon sa ulat ng LinkedIn Emerging Jobs[2], 2020, nanguna ang Data Scientist sa listahan ng 'Emerging Jobs' sa loob ng tatlong taon na tumatakbo at inaasahang lalago sa 37% taun taon. Ito ay isang espesyalidad na patuloy na lumalaki nang malaki sa lahat ng mga industriya, na iniugnay sa ebolusyon ng mga dating umiiral na trabaho at nadagdagan ang diin sa data sa akademikong pananaliksik.
Anong mga kasanayan ang kailangan ng isang Data scientist upang maging matagumpay
Ang Data Science ay isang cross disciplinary set ng mga kasanayan na matatagpuan sa intersection ng mga istatistika, programming ng computer, at kadalubhasaan sa domain. Binubuo ito ng tatlong magkakaiba at magkakapatong na lugar:
- Mga istatistika, upang i modelo at ibuod ang mga hanay ng data
- Computer science, upang magdisenyo at gumamit ng mga algorithm upang mag imbak, magproseso at mag visualize ng data
- Domain kadalubhasaan, kinakailangan upang formulate ang tamang mga katanungan at upang ilagay ang mga sagot sa konteksto
- Ang iba pang mga kasanayan na madalas na hindi nakuha ay:
- Pamumuno
- Pagtutulungan sa koponan
- Komunikasyon