Nastavnici

Naziv kolegija: Računarska lingvistika

Nastavnik: izv.prof. dr. sc. Kristina Kocijan

ECTS-bodovi: 6

Jezik: hrvatski

Trajanje: jedan semestar (7. | 9.)

Status: obavezni za studente jednopredmetnog diplomskog studija informatike, istraživački smjer, izborni za ostale studije

Oblik nastave: 2 sata predavanja - 2 sata seminara

Ispit: pismeni i praktični

 

Sadržaj

Pregled naredbi, struktura podataka i standardnih modula alata za obradu prirodnih jezika - NooJ. Uvod u obradu prirodnih jezika: token, leksičke kategorije, rečenica, korpusi. Pretraživanje teksta: tekst kao lista riječi, tokenizacija, parovi riječi (bigrams), kolekcije. Pristupanje tekstualnim korpusima i leksički resursi. Semantičke mreže riječi. Komadanje (chunking) uz pomoć regularnih izraza. Prikaz osnovne sintaksne strukture prirodnog jezika beskontekstnom gramatikom. Sintaksna analiza rečenica prirodnog jezika: parsiranjem (rekurzivni spust) i prepoznavanjem (prepoznavač jezika sa svojstvima).

 

Sadržaj seminara

Rješavanje individualnog projektnog zadatka izradom praktičnog programskog rješenja u NooJ okruženju.

 

Opće i specifične kompetencije

Student će dobiti temeljna znanja iz discipline obrade prirodnih jezika i bit će osposobljen da može samostalno modelirati postupke leksičke i sintaksne analize prirodnih jezika. Također će znati koristiti alate za ekstrahiranje informacija iz tekstova rečenica napisanih u prirodnom jeziku.

 

Ishodi učenja

Nakon uspješno savladanog predmeta, student će moći:

1) Opisati leksička, sintaksna i semantička svojstva prirodnih jezika.
2) Modelirati beskontekstnu gramatiku osnovne strukture rečenica prirodnog jezika.
3) Izabrati postupak parsiranja ili prepoznavanja rečenica prirodnog jezika.
4) Oblikovati i realizirati vlastite algoritme za leksičku i sintaktsnu analizu tekstova rečenica napisanih u prirodnom jeziku.

 

Način održavanja nastave

  • Predavanja: kombinirano, klasično (ploča) i prikazom primjera izvedbom na PCu i projiciranjem uz istodobno pisanje primjera programa od strane studenata na svojim računalima.
  • Seminar: rješavanje zadanog projektnog (seminarskog) rada uz konzultiranje s predmetnim nastavnikom.

 

Obveze studenata i uvjeti

Obvezno pohađanje nastave.

 

Način provjere znanja

Praćenje rada i aktivnosti studenata tijekom semestra:

  • pohađanje predavanja
  • sudjelovanje na nastavi
  • izrada projekta

Skala ocjena: 
dovoljno (2) 60% - 69%
dobro (3) 70% - 79%
vrlo dobro (4) 80% - 89%
izvrsno (5) 90% - 100%

 

Obavezna literatura

  1. Jurafsky, D.; Martin, J.H.: Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition, 2009. [u knjižnici: 2000, 2009 (poglavlja 1-6; 12-16)]
  2. Silberztein, M.: Formalizing Natural Languages: The NooJ Approach, Wiley, 2016. [u knjižnici]

 

Preporučena literatura

  1. Bird, S.; Klein, E.; Loper, E.: Natural Language Processing with Python, O’Reilly Media, 2009.
  2. Clark, A.; Fox, C.; Lappin, S. (eds.): The handbook of computational linguistics and natural language processing, 2010. [u knjižnici]
  3. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI  • prevođenje i primjene, Element,  Zagreb, 2013.
  4. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI  • regularni izrazi, gramatike, automati, Element,  Zagreb, 2012. [u knjižnici]
  5. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI  • sintaksna analiza i primjene, Element,  Zagreb, 2012.
  6. Grishman, R.: Computational linguistics: an introduction, Cambridge University Press, 1986. [u knjižnici]
  7. Harris, M.D.: Introduction to Natural Language Processing. Prentice Hall, 1985.
  8. Lawer, J.M.;  Dry, H.A. (eds.): Using computers in linguistics: a practical guide, 1998. [u knjižnici]

Seminarska literatura

  1. Proceedings of the 2007 International Nooj Conference
  2. Applications of finite-state language processing : selected papers from the 2008 International NooJ Conference
  3. Proceedings of the Nooj 2010 International Conference and Workshop
  4. Automatic processing of various levels of linguistic phenomena : selected papers from the NooJ 2011 International Conference
  5. Formalising natural languages with NooJ
  6. Formalising natural languages with NooJ 2013 : selected papers from the NooJ 2013 International Conference