Big Data ja datan hallinta (3op)
Opintojakson tunnus: DT10025
Opintojakson perustiedot
- Laajuus
 - 3 op
 
- Opetuskieli
 - suomi
 
- Vastuuhenkilö
 - Jarmo Talvivaara, Vastuuopettaja
 - Joni Ranta, Vastuuopettaja
 
Osaamistavoitteet
Opiskelijana
- tunnet ja osaat arvioda datan merkitystä organisaatioiden toiminnalle.  
- tunnet perinteisen datanhallinnan ja big datan hallinnan perusteet ja erityispiirteitä.  
- tunnet ja osaat soveltaa dataintegraation ja tietovarastoinnin periaatteita, suunnittelu- ja toteutustapoja ja teknologioita  
- osaat tuottaa teknisen ratkaisun eri tietolähteistä tiedon siirron ja koostamisen toteuttavan ETL/ELT -prosessin.  
- tunnet rajapintojen sekä erilaisten tiedontallennus ja –siirtoformaattien merkityksen tietovarastoinnissa ja muissa datan hallinnan sovelluskohteissa.  
- ymmärrät datan laadunhallinnan perusteet ja osaa soveltaa niitä.  
- ymmärrät automaation merkityksen datan hallintaan liittyen. 
- ymmärrät tietoturvan merkityksen datan hallinnassa.
                    
Sisältö
- Datan merkitys organisaatioiden toiminnalle. 
- Datan hallinta ja hyödyntäminen; perinteinen ja big data, sovelluskohteita (operatiiviset järjestelmät, tietovarastot, visualisointi, analytiikka, automaatio, koneoppiminen)   
- Data engineering, datan hallinnan ratkaisut, alustat, teknologiat ja  prosessit (on-premises-cloud-hybrdid, tietokannat, data warehouse - tietovarastot, data lake, ETL, ELT, OLAP, järjestelmäriippumattomat ratkaisut) 
- APIt/rajapinnat ja formaatit; mm. siirtotiedostot: CSV, XML, JSON, tietokantarajapinnat: SQL, noSQL, tietovarastot, web services –verkkopalvelut, järjestelmäkohtaiset APIt. 
- Datan prosessointi ja transformaatiot (muunnokset) 
- Datan laadunhallinta (data quality management) 
- Prosessit, automaatio ja datanhallinta 
- Järjestelmäriippumattomat (agnostic) datanhallintaratkaisut.  
- Datan hallinnan automatisointitarpeita ja mahdollisuuksia.  
- Tietoturvan erityiskysymyksiä datan hallintaan liittyen.