• Šifra predmeta:63560
  • Kreditne točke:6
  • Semester: poletni
  • Vsebina

Uvod v velepodatke. Značilnosti velepodatkov,. Velepodatki in podatkovna znanost. Relacijske podatkovne baze in velepodatki. Porazdeljeni podatkovni sistemi. Hadoop ekosistem.

Upravljanje z velepodatki. Podatkovni modeli za strukturirane in delno strukturirane podatke. Nerelacijski (NoSQL) podatkovni modeli. Podatkovni modeli in sistemi za upravljanje z velepodatki.

Obdelava velepodatkov. Povpraševanje in pridobivanje podatkov. Paradigme za obdelavo velepodatkov. Procesni cevovodi in agregatorji. Osnovni gradniki  in vzorci pisanja algoritmov. Hadoop in Spark.

Analitika velepodatkov. Orodja za podatkovno analitika. Osnovna statistika. Gručenje. Asociacije. Napovedno modeliranje. Knjižnica orodij za strojno učenje Spark MLib.

Velepodatki in analiza grafov. NoSQL grafne baze za delo z velepodatki. Neo4j grafna baza. Povpraševanje po grafih z jezikom CYPHER. Osnovna analiza grafov z Neo4j in CYPHER.

Praktični vidiki analize velepodatkov. Obdelava heterogenih podatkov. Obdelava podatkovnih tokov.

  • Študijski programi
  • Porazdelitev ur na semester
45
ur
predavanj
30
ur
laboratorijskih vaj
  • Izvajalci
Nosilec predmeta
Prostor:R2.04 - Kabinet
Asistent
Prostor:R2.26 - Laboratorij LKM