Siirry suoraan sisältöön

Big Data ja datan hallintaLaajuus (3 op)

Opintojakson tunnus: DT10025

Opintojakson perustiedot


Laajuus
3 op
Opetuskieli
suomi
Vastuuhenkilö
Jarmo Talvivaara, Vastuuopettaja
Joni Ranta, Vastuuopettaja

Osaamistavoitteet

Opiskelijana
- tunnet ja osaat arvioda datan merkitystä organisaatioiden toiminnalle.
- tunnet perinteisen datanhallinnan ja big datan hallinnan perusteet ja erityispiirteitä.
- tunnet ja osaat soveltaa dataintegraation ja tietovarastoinnin periaatteita, suunnittelu- ja toteutustapoja ja teknologioita
- osaat tuottaa teknisen ratkaisun eri tietolähteistä tiedon siirron ja koostamisen toteuttavan ETL/ELT -prosessin.
- tunnet rajapintojen sekä erilaisten tiedontallennus ja –siirtoformaattien merkityksen tietovarastoinnissa ja muissa datan hallinnan sovelluskohteissa.
- ymmärrät datan laadunhallinnan perusteet ja osaa soveltaa niitä.
- ymmärrät automaation merkityksen datan hallintaan liittyen.
- ymmärrät tietoturvan merkityksen datan hallinnassa.

Sisältö

- Datan merkitys organisaatioiden toiminnalle.
- Datan hallinta ja hyödyntäminen; perinteinen ja big data, sovelluskohteita (operatiiviset järjestelmät, tietovarastot, visualisointi, analytiikka, automaatio, koneoppiminen)
- Data engineering, datan hallinnan ratkaisut, alustat, teknologiat ja prosessit (on-premises-cloud-hybrdid, tietokannat, data warehouse - tietovarastot, data lake, ETL, ELT, OLAP, järjestelmäriippumattomat ratkaisut)
- APIt/rajapinnat ja formaatit; mm. siirtotiedostot: CSV, XML, JSON, tietokantarajapinnat: SQL, noSQL, tietovarastot, web services –verkkopalvelut, järjestelmäkohtaiset APIt.
- Datan prosessointi ja transformaatiot (muunnokset)
- Datan laadunhallinta (data quality management)
- Prosessit, automaatio ja datanhallinta
- Järjestelmäriippumattomat (agnostic) datanhallintaratkaisut.
- Datan hallinnan automatisointitarpeita ja mahdollisuuksia.
- Tietoturvan erityiskysymyksiä datan hallintaan liittyen.

Siirry alkuun