Naziv kolegija: Računalni gramatički modeli
Nastavnik: prof. dr. sc. Sanja Seljan
Izvođači: Sanja Seljan, Ivan Dunđer
ECTS-bodovi: 5
Jezik: hrvatski/ engleski/ francuski
Trajanje: 1 semestar
Status: obavezni/ izborni
Oblik nastave: 1 sat predavanja, 1 sat vježbi, 1 sat seminara
Uvjeti: obavezni/ izborni
Ispit: pismeni/usmeni + seminar + vježbe
Sadržaj:
Cilj predmeta jest upoznati studente s interdisciplinarnim područjem koje ujedinjuje informatiku i lingvistiku te prikazati primjenu formalnih gramatika u jezičnim tehnologijama. Studenti će se upoznati s mogućnostima i ograničenjima primjene računalnih gramatičkih modela, osobito modela Leksičko-funkcionalne gramatike i alata za jezični inženjering te prikazati njihovu informatičku primjenu. Osim teorijskih znanja, studenti će steći vještine i kompetencije potrebne za kritičku evaluaciju računalnih gramatičkih modela te se osposobiti za samostalnu izradu segmenata formalnih gramatika uz primjenu računala.
Studenti će se upoznati se mogućnostima, ograničenjima, osnovnim principima i stvarnom primjenom računalnog formalnog modela Leksičko-funkcionalne gramatike (LFG). Primjenom LFG računalnog modela i XLE alata za jezičnih inženjering (Xerox Linguistic Engineering) formalizirat će se jezični segmenti na razini riječi, fraza i rečenica za engleski, hrvatski i, po potrebi, na drugim jezicima i s drugim alatima za obradu jezika. Kroz postupke računalne formalizacije na više jezičnih razina (leksičkoj, sintaktičkoj, semantičkoj) samostalno će se izrađivati manje gramatike za računalnu obradu jezika.
Ishodi
Način izvođenja nastave
- frontalno i primjenom sustava za e-učenje
Ocjenjivanje
Pohađanje nastave
Izvršeni zadaci na vježbama
Seminarski rad
Pismeni/ usmeni
Praćenje kvalitete i uspješnosti predmeta:
Provjera kvalitete i uspješnosti izvedbe predmeta vršit će se kombiniranjem unutrašnje i vanjske evaluacije, npr. metodom ankete na kraju semestra, kroz interes studenata za dodatni angažman (sudjelovanje u istraživanjima, završni rad, praksa), prisustvovanjem kolega s drugih odsjeka ili institucija/kompanija, sudjelovanjem na skupovima/ kongresima.
Obvezna literatura
1, Bresnan, Joan. Lexical-Functional Syntax. Blackwell Publishers, 2001
2. Falk, Yehuda. Lexical-Functional Grammar: An Introduction to Parallel Constraint-Based Syntax. Lecture Notes No 126. Stanford: CSLI, 2001.
3. Seljan, Sanja. The Role of the Lexicon in Lexical-Functional Grammar - Example on Croatian // Proceedings of Language Technologies Conference IS-LTC 2006. Ljubljana, 2006, 198-203
4. Dick Crouch, Mary Dalrymple, Ron Kaplan, Tracy King, John Maxwell, and Paula Newman. XLE Documentation, 2008. Walkthrough, Xerox Corporation and Copyright, Palo Alto Research Center
5. Seljan, S. Lexical - Functional Grammar - Example on Croatian // Proceedings of 5th International Language Technologies Conference IS-LTC 2006. Ljubljana, 2006, 198-203
6. Seljan, Sanja. Unifikacijske gramatike kao okvir za leksičko-funkcionalnu gramatiku (LFG). Suvremena lingvistika 1-2, 47-48. Zagreb, 1999, 181-193
7. Seljan, Sanja. Lexical-Functional Grammar: Theoretical and Practical Models. XIX International Conference of the Association of Young Linguists, 10-12 March 2004, Valencia, Proceedings Interlinguistica No15. 1279-1288
Dopunska literatura:
1. Bryl, Anton and van Genabith, Josef . Two approaches to automatic matching of atomic grammatical features in LFG. CSLI Publications, 2010.
2. Thomann, J., LFG as a pedagogical grammar, in King, T. and Butt, M. (eds.) 'Proceedings of the LFG02 Conference,' (Stanford: CSLI Publications 2002)
3. Miriam Butt, Tracy Holloway King, María-Eugenia Niño, and Frédérique Segond, A Grammar Writer's Cookbook, 1999.
4. Sanja Seljan, Kristina Vučković, Zdravko Dovedan. Sentence Representation in Context-Sensitive Grammars. Suvremena lingvistika 1-2 (53-54), 2002, 205-218
5. Butt, Miriam; Dipper, Stephanie; Frank, Anette; Holloway King, Tracy. Writing Large-Scale Parallel Grammars for English, French and German. Proceedings of LFG99 Conference. CSLI Publications
6. Abbas Ali Ahangar, Nader Jahangiri, Fahimeh Mohammadpour. A Lexical-Functional Model for Machine Translation of English Zero-place Predicators, International Journal of English Linguistics, Vol. 2, No. 3; 2012.
7. Seljan, Sanja. Formal Description of Some Linguistic Phenomena in Croatian by Lexical-Functional Grammar (LFG). Zbornik radova Odsjeka za informacijske znanosti. Zagreb: Zavod za informacijske studije Odsjeka za informacijske znanosti Filozofskog fakulteta sveučilišta u Zagrebu, 2002, 119-132
12. Grammar Writer's Workbench for Lexical Functional Grammar
13. Fortmann, Christian; Forst, Martin. An LFG grammar checker for CALL, In ICALL, 2004.
14. Stefan Riezler, Tracy H. King, Ronald M. Kaplan, Richard S. Crouch, John T. Maxwell III, Mark Johnson: Parsing the Wall Street Journal using a Lexical-Functional Grammar and Discriminative Estimation Techniques. ACL 2002, 271-278
15. K.Owczarzak, J. Genabith, A. Way. Evaluating machine translation with LFG dependencies. Machine Translation , Vol. 21 (2), 2007.
16. Fahime Mohammadpour, Abbas Ali Ahangar, Nader Jahangiri. Building a Hybrid Machine Translation System for Translating. English Linguistics Research, Vol. 1, No. 2; 2012
17. Dalyrmple M., Kaplan R. M., Maxwell III J. T., Zaenen, A., ed: Formal Issues in Lexical-Functional Grammar. Stanford: CSLI, 1995.
Naziv kolegija: Teorija sintaksne analize i primjene
Nastavnik: prof. dr. sc. Zdravko Dovedan Han
ECTS-bodovi: 6
Jezik: hrvatski
Trajanje: jedan semestar (8.)
Status: obavezan za studente jednopredmetnog diplomskog studija informatike, istraživački smjer, izborni za ostale studije
Oblik nastave: 1 sat predavanja - 2 sata seminara - 1 sat vježbi
Uvjeti: Algoritmi i strukture podataka i Uvod u formalne jezike i automate
Ispit: pismeni i usmeni
Sadržaj
Uvod: temeljni pojmovi teorije formalnih jezika. Uvod u teoriju sintaksne analize: parsiranje, prepoznavanje. Prepoznavanje regularnih jezika: konačni prepoznavač, regularni izrazi i pretraživanje. Prepoznavači beskontekstnih jezika: stogovni prepoznavač, prepoznavač s praznim stogom, prošireni stogovni automat, gramatika i ekvivalentni prošireni stogovni automat. Višeprolazno parsiranje: silazna sintaksna analiza, uzlazna sintaksna analiza. Tablični postupci sintaksne: Cocke-Younger-Kasamijev algoritam (CYK), Earleyjev postupak parsiranja. LL(k) jezici i sintaksna analiza: jezici tipa LL(k), predikatna sintaksna analiza, sintaksna analiza LL(1) jezika. LR(k) jezici i sintaksna analiza: jezici tipa LR(k), LR(0) gramatike i stogovni prepoznavači, sintaksna analiza LR(1) jezika, gramatike s relacijom prioriteta. Prepoznavač kontekstnih jezika: dvostruko-stogovni prepoznavač, dvostruko-stogovni prepoznavač s jednim stanjem, Turingov stroj. Prepoznavač jezika sa svojstvima: jezici sa svojstvima, prepoznavač jezika sa svojstvima.
Sadržaj vježbi
Vježbe slijede predavanja. Sva teorijska razmatranja i definicije upotpunjavaju se odgovarajućim primjerima. Svi se algoritmi implementiraju u jeziku Python.
Sadržaj seminara
Rješavanje individualnog projektnog zadatka izradom praktičnog programskog rješenja (parsera ili prepoznavača) u jeziku Python, a za izabrani postupak sintaksne analize. Student predstavlja svoj rad u pisanom obliku i brani ga usmeno pred predmetnim nastavnikom.
Opće i specifične kompetencije
Student će dobiti temeljna znanja iz discipline formalnih jezika, posebno sintaksne analize, neophodna za primjenu u identifikaciji ulaznog jezika i definiranju postupka za njegovu sintaksnu analizu.
Ishodi učenja
Nakon uspješno savladanog predmeta, student će moći:
1) Definirati pojam sintaksne analize .
2) Modelirati regularni izraze za prepoznavanje regularnih jezika.
3) Provesti istraživanja o efikasnosti postupaka sintaksne analize beskontekstnih jezika.
4) Primijeniti optimalan postupak sintaksne analize.
5) Primijeniti stečena znanja u drugim predmetima studija.
Način održavanja nastave
Obveze studenata i uvjeti
Obvezno pohađanje nastave (predavanja i vježbi).
Način provjere znanja
Praćenje rada i aktivnosti studenata tijekom semestra:
Seminarski rad:
Skala ocjena:
dovoljno (2) 50% - 59%
dobro (3) 60% - 69%
vrlo dobro (4) 70% - 79%
izvrsno (5) 80% - 100%
Obavezna literatura
Preporučena literatura
Aho, V. A.; Ullman, D. J.: The Theory of Parsing, Translation, and Compiling, vol. I: Parsing,
Prentice-Hall, 1972.
Naziv kolegija: Odabrana poglavlja obrade prirodnog jezika
Nastavnici: prof. dr.sc. Nives Mikelić Preradović, doc. dr. sc. Nikola Ljubešić
ECTS bodovi: 5
Jezik: hrvatski
Trajanje: jedan semestar
Status: izborni kolegij
Oblik nastave: 1 sat predavanja, 2 sata seminara
Uvjeti za upis kolegija: nema
Ciljevi kolegija:
Automatska izgradnja bilo kojeg resursa prirodnog jezika zahtijeva dobro razumijevanje svojstava tog prirodnog jezika te lingvističkih i statističkih metoda obrade prirodnog jezika. Studenti će usvojiti lingvističke i statističke koncepte koji se koriste u obradi jezika i svladati automatske metode izgradnje primarnih i sekundarnih resursa za hrvatski jezik. Studenti stječu kompetencije, znanja i vještine u primjeni metoda automatske obrade prirodnog jezika te stječu znanje o brojnim temama i sustavima koji se bave različitim problemima obrade hrvatskog i drugih prirodnih jezika.
Očekivani ishodi učenja:
usvajanje znanja o izradi sustava automatskog sažimanje teksta različitim statističkim i lingvističkim metodama, sustava za analizu sentimenta, sustava za prepoznavanje naziva, usvajanje znanja i vještina izrade morfoloških leksikona flektivnih jezika, mrežnih korpusa, itd..
Sadržaj kolegija:
Sadržaj predmeta će se mijenjati iz godine u godinu s obzirom na teme obrade prirodnih jezika kojima se iz godine u godinu mijenja važnost.
Način polaganja ispita: seminarski rad, praktičan rad, pismeni ispit
ECIL
Europska konferencija o informacijskoj pismenosti - European Conference on Information Literacy (ECIL) serija je konferencija koju organiziraju Odsjek za upravljanje informacijama Sveučilišta Hacettepe iz Ankare, Odsjek za informacijske i komunikacijske znanosti Filozofskog fakulteta Sveučilišta u Zagrebu i Međunarodno udruženje za informacijsku pismenost (InLitAs).