Big Data ja datan hallintaLaajuus (3 op)
Opintojakson tunnus: DT10025
Opintojakson perustiedot
- Laajuus
- 3 op
- Opetuskieli
- suomi
- Vastuuhenkilö
- Jarmo Talvivaara, Vastuuopettaja
- Joni Ranta, Vastuuopettaja
Osaamistavoitteet
Opiskelijana
- tunnet ja osaat arvioda datan merkitystä organisaatioiden toiminnalle.
- tunnet perinteisen datanhallinnan ja big datan hallinnan perusteet ja erityispiirteitä.
- tunnet ja osaat soveltaa dataintegraation ja tietovarastoinnin periaatteita, suunnittelu- ja toteutustapoja ja teknologioita
- osaat tuottaa teknisen ratkaisun eri tietolähteistä tiedon siirron ja koostamisen toteuttavan ETL/ELT -prosessin.
- tunnet rajapintojen sekä erilaisten tiedontallennus ja –siirtoformaattien merkityksen tietovarastoinnissa ja muissa datan hallinnan sovelluskohteissa.
- ymmärrät datan laadunhallinnan perusteet ja osaa soveltaa niitä.
- ymmärrät automaation merkityksen datan hallintaan liittyen.
- ymmärrät tietoturvan merkityksen datan hallinnassa.
Sisältö
- Datan merkitys organisaatioiden toiminnalle.
- Datan hallinta ja hyödyntäminen; perinteinen ja big data, sovelluskohteita (operatiiviset järjestelmät, tietovarastot, visualisointi, analytiikka, automaatio, koneoppiminen)
- Data engineering, datan hallinnan ratkaisut, alustat, teknologiat ja prosessit (on-premises-cloud-hybrdid, tietokannat, data warehouse - tietovarastot, data lake, ETL, ELT, OLAP, järjestelmäriippumattomat ratkaisut)
- APIt/rajapinnat ja formaatit; mm. siirtotiedostot: CSV, XML, JSON, tietokantarajapinnat: SQL, noSQL, tietovarastot, web services –verkkopalvelut, järjestelmäkohtaiset APIt.
- Datan prosessointi ja transformaatiot (muunnokset)
- Datan laadunhallinta (data quality management)
- Prosessit, automaatio ja datanhallinta
- Järjestelmäriippumattomat (agnostic) datanhallintaratkaisut.
- Datan hallinnan automatisointitarpeita ja mahdollisuuksia.
- Tietoturvan erityiskysymyksiä datan hallintaan liittyen.