Naziv kolegija: Računarska lingvistika
Nastavnik: izv.prof. dr. sc. Kristina Kocijan
ECTS-bodovi: 6
Jezik: hrvatski
Trajanje: jedan semestar (7. | 9.)
Status: obavezni za studente jednopredmetnog diplomskog studija informatike, istraživački smjer, izborni za ostale studije
Oblik nastave: 2 sata predavanja - 2 sata seminara
Ispit: pismeni i praktični
Sadržaj
Pregled naredbi, struktura podataka i standardnih modula alata za obradu prirodnih jezika - NooJ. Uvod u obradu prirodnih jezika: token, leksičke kategorije, rečenica, korpusi. Pretraživanje teksta: tekst kao lista riječi, tokenizacija, parovi riječi (bigrams), kolekcije. Pristupanje tekstualnim korpusima i leksički resursi. Semantičke mreže riječi. Komadanje (chunking) uz pomoć regularnih izraza. Prikaz osnovne sintaksne strukture prirodnog jezika beskontekstnom gramatikom. Sintaksna analiza rečenica prirodnog jezika: parsiranjem (rekurzivni spust) i prepoznavanjem (prepoznavač jezika sa svojstvima).
Sadržaj seminara
Rješavanje individualnog projektnog zadatka izradom praktičnog programskog rješenja u NooJ okruženju.
Opće i specifične kompetencije
Student će dobiti temeljna znanja iz discipline obrade prirodnih jezika i bit će osposobljen da može samostalno modelirati postupke leksičke i sintaksne analize prirodnih jezika. Također će znati koristiti alate za ekstrahiranje informacija iz tekstova rečenica napisanih u prirodnom jeziku.
Ishodi učenja
Nakon uspješno savladanog predmeta, student će moći:
1) Opisati leksička, sintaksna i semantička svojstva prirodnih jezika.
2) Modelirati beskontekstnu gramatiku osnovne strukture rečenica prirodnog jezika.
3) Izabrati postupak parsiranja ili prepoznavanja rečenica prirodnog jezika.
4) Oblikovati i realizirati vlastite algoritme za leksičku i sintaktsnu analizu tekstova rečenica napisanih u prirodnom jeziku.
Način održavanja nastave
- Predavanja: kombinirano, klasično (ploča) i prikazom primjera izvedbom na PCu i projiciranjem uz istodobno pisanje primjera programa od strane studenata na svojim računalima.
- Seminar: rješavanje zadanog projektnog (seminarskog) rada uz konzultiranje s predmetnim nastavnikom.
Obveze studenata i uvjeti
Obvezno pohađanje nastave.
Način provjere znanja
Praćenje rada i aktivnosti studenata tijekom semestra:
- pohađanje predavanja
- sudjelovanje na nastavi
- izrada projekta
Skala ocjena:
dovoljno (2) 60% - 69%
dobro (3) 70% - 79%
vrlo dobro (4) 80% - 89%
izvrsno (5) 90% - 100%
Obavezna literatura
- Jurafsky, D.; Martin, J.H.: Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition, 2009. [u knjižnici: 2000, 2009 (poglavlja 1-6; 12-16)]
- Silberztein, M.: Formalizing Natural Languages: The NooJ Approach, Wiley, 2016. [u knjižnici]
Preporučena literatura
- Bird, S.; Klein, E.; Loper, E.: Natural Language Processing with Python, O’Reilly Media, 2009.
- Clark, A.; Fox, C.; Lappin, S. (eds.): The handbook of computational linguistics and natural language processing, 2010. [u knjižnici]
- Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • prevođenje i primjene, Element, Zagreb, 2013.
- Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • regularni izrazi, gramatike, automati, Element, Zagreb, 2012. [u knjižnici]
- Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI • sintaksna analiza i primjene, Element, Zagreb, 2012.
- Grishman, R.: Computational linguistics: an introduction, Cambridge University Press, 1986. [u knjižnici]
- Harris, M.D.: Introduction to Natural Language Processing. Prentice Hall, 1985.
- Lawer, J.M.; Dry, H.A. (eds.): Using computers in linguistics: a practical guide, 1998. [u knjižnici]
Seminarska literatura
- Proceedings of the 2007 International Nooj Conference
- Applications of finite-state language processing : selected papers from the 2008 International NooJ Conference
- Proceedings of the Nooj 2010 International Conference and Workshop
- Automatic processing of various levels of linguistic phenomena : selected papers from the NooJ 2011 International Conference
- Formalising natural languages with NooJ
- Formalising natural languages with NooJ 2013 : selected papers from the NooJ 2013 International Conference