Naslovnica

Naziv kolegija: Računalna obrada povijesnih tekstova

Nastavnik: dr. sc. Petra Bago, doc.

ECTS-bodovi: 3

Jezik: hrvatski (engleski)

Trajanje: 1 semestar (2. i 4. semestar)

Status: izborni kolegij za sve smjerove na Odsjeku i FF-u

Oblik nastave: 2 sata seminara

Uvjeti: nema

Ispit: Izrada seminarskog rada u kojem će se pomoću dostupnih alata načiniti analiza odabranih konkretnih povijesnih tekstova.

Sadržaj: 

Osnovni pojmovi računalne obrade tekstualnih i jezičnih podataka. Relacijski model podataka i jezici za označavanje. Vrste jezičnih baza podataka: korpusi – pojavnice, različnice, leme – lematizacija. Jezični alati. Načela strojne obrade i analize digitalizirane povijesne građe Analiza i segmentacija digitaliziranih tekstova s jezičnim sadržajem. Statistička analiza teksta. Mogućnosti rječničke, jezične, gramatičke, terminološke, usporedne i temporalne analize. Mogućnosti primjene u drugim područjima.

Cilj – opće i specifične kompetencije:

Studenti će upoznati mogućnosti automatske statističke i jezične obrade teksta te njihove primjene u znanstvenim i stručnim povijesnim istraživanjima.

Obvezatna literatura:

  1. Piotrowski, Michael. "Natural language processing for historical texts." Synthesis Lectures on Human Language Technologies 5.2 (2012): 1-157.
  2. Bibliografska i rječnička baza znanstveno-istraživačkog projekta "Hrvatska rječnička baština i prikaz rječničkoga znanja", Odsjek za informacijske znanosti Filozofskog fakulteta u Zagrebu, Zagreb, 2004 (računalno dostupna)

Dodatna literatura:

  1. Tadić, Marko. Jezične tehnologije i hrvatski jezik. Zagreb: Ex libris, 2003.