Naslovnica

 

Naziv kolegija: Računalni gramatički modeli

Nastavnik: prof. dr. sc. Sanja Seljan

Izvođači: Sanja Seljan, Ivan Dunđer

ECTS-bodovi: 5

Jezik: hrvatski/ engleski/ francuski

Trajanje: 1 semestar

Status: obavezni/ izborni

Oblik nastave: 1 sat predavanja, 1 sat vježbi, 1 sat seminara

Uvjeti: obavezni/ izborni

Ispit: pismeni/usmeni + seminar + vježbe

 

Sadržaj:

Cilj predmeta jest upoznati studente s interdisciplinarnim područjem koje ujedinjuje informatiku i lingvistiku te prikazati primjenu formalnih gramatika u jezičnim tehnologijama. Studenti će se upoznati s mogućnostima i ograničenjima primjene računalnih gramatičkih modela, osobito modela Leksičko-funkcionalne gramatike i alata za jezični inženjering te prikazati njihovu informatičku primjenu. Osim teorijskih znanja, studenti će steći vještine i kompetencije potrebne za kritičku evaluaciju računalnih gramatičkih modela te se osposobiti za samostalnu izradu segmenata formalnih gramatika uz primjenu računala.

Studenti će se upoznati se mogućnostima, ograničenjima, osnovnim principima i stvarnom primjenom računalnog formalnog modela Leksičko-funkcionalne gramatike (LFG). Primjenom LFG računalnog modela i XLE alata za jezičnih inženjering (Xerox Linguistic Engineering) formalizirat će se jezični segmenti na razini riječi, fraza i rečenica za engleski, hrvatski i, po potrebi, na drugim jezicima i s drugim alatima za obradu jezika. Kroz postupke računalne formalizacije na više jezičnih razina (leksičkoj, sintaktičkoj, semantičkoj) samostalno će se izrađivati manje gramatike za računalnu obradu jezika.

 

Ishodi

  • Usvajanje znanja o načinu izgradnje računalnih gramatičkih modela i mogućoj primjeni u konkretnim situacijama
  • Usvajanje znanja o računalom formalnom modelu Leksičko-funkcionalne gramatike (LFG), o načinu formalizacije, osnovnim principima, ograničenjima i primjeni
  • Usvajanje znanja i vještina u radu s XLE softverom (Xerox Language Engineering) i po potrebi drugim alatima
  • Stjecanje znanja i vještina za primjena LFG modela na jezičnim segmentima za engleski, hrvatski i dr. po potrebi
  • Integracija i predlaganje vlastitog modela primjenom LFG računalnog modela i XLE alata za jezični inženjering na više razina rečenične obrade
  • Oblikovanje, primjena, kritičko prosuđivanje i prijedlog sustava utemeljenog na riječima i rečenicama
  • Sinteza, integracija i prijedlog primjene informatičkih, informacijskih i logičkih modela u procesu jezičnog inženjeringa i računalne obrade jezika
  • Demonstracija načela računalne analize digitalnog leksikona integriranog u računalni jezični sustav
  • Razvoj metoda korpusne analize i integracije rezultata s drugim metodama i alatima jezičnog inženjeringa
  • Planiranje, organizacija, provođenje znanstvenog istraživanja i analiza primjene računalne lingvistike, stjecanje prezentacijskih i komunikacijskih vještina
  • Razvoj vještina učenja koje omogućuju cjeloživotno obrazovanje


Način izvođenja nastave

- frontalno i primjenom sustava za e-učenje

    • Predavanja – teorijski dio
    • Vježbe – kroz samostalne zadatke
    • Seminar – kroz samostalni ili timski rad

 

Ocjenjivanje

Pohađanje nastave

Izvršeni zadaci na vježbama

Seminarski rad

Pismeni/ usmeni


Praćenje kvalitete i uspješnosti predmeta:

Provjera kvalitete i uspješnosti izvedbe predmeta vršit će se kombiniranjem unutrašnje i vanjske evaluacije, npr. metodom ankete na kraju semestra, kroz interes studenata za dodatni angažman (sudjelovanje u istraživanjima, završni rad, praksa), prisustvovanjem kolega s drugih odsjeka ili institucija/kompanija, sudjelovanjem na skupovima/ kongresima.

 

Obvezna literatura

1, Bresnan, Joan. Lexical-Functional Syntax. Blackwell Publishers, 2001

2. Falk, Yehuda. Lexical-Functional Grammar: An Introduction to Parallel Constraint-Based Syntax. Lecture Notes No 126. Stanford: CSLI, 2001.

3. Seljan, Sanja. The Role of the Lexicon in Lexical-Functional Grammar - Example on Croatian // Proceedings of Language Technologies Conference IS-LTC 2006. Ljubljana, 2006, 198-203

4. Dick Crouch, Mary Dalrymple, Ron Kaplan, Tracy King, John Maxwell, and Paula Newman. XLE Documentation, 2008. Walkthrough, Xerox Corporation and Copyright, Palo Alto Research Center

5. Seljan, S. Lexical - Functional Grammar - Example on Croatian // Proceedings of 5th International Language Technologies Conference IS-LTC 2006. Ljubljana, 2006, 198-203

6. Seljan, Sanja. Unifikacijske gramatike kao okvir za leksičko-funkcionalnu gramatiku (LFG). Suvremena lingvistika 1-2, 47-48. Zagreb, 1999, 181-193

7. Seljan, Sanja. Lexical-Functional Grammar: Theoretical and Practical Models. XIX International Conference of the Association of Young Linguists, 10-12 March 2004, Valencia, Proceedings Interlinguistica No15. 1279-1288

 

Dopunska literatura:

1. Bryl, Anton and van Genabith, Josef . Two approaches to automatic matching of atomic grammatical features in LFG. CSLI Publications, 2010.

2. Thomann, J., LFG as a pedagogical grammar, in King, T. and Butt, M. (eds.) 'Proceedings of the LFG02 Conference,' (Stanford: CSLI Publications 2002)

3. Miriam Butt, Tracy Holloway King, María-Eugenia Niño, and Frédérique Segond, A Grammar Writer's Cookbook, 1999.

4. Sanja Seljan, Kristina Vučković, Zdravko Dovedan. Sentence Representation in Context-Sensitive Grammars. Suvremena lingvistika 1-2 (53-54), 2002, 205-218

5. Butt, Miriam; Dipper, Stephanie; Frank, Anette; Holloway King, Tracy. Writing Large-Scale Parallel Grammars for English, French and German. Proceedings of LFG99 Conference. CSLI Publications

6. Abbas Ali Ahangar, Nader Jahangiri, Fahimeh Mohammadpour. A Lexical-Functional Model for Machine Translation of English Zero-place Predicators, International Journal of English Linguistics, Vol. 2, No. 3; 2012.

7. Seljan, Sanja. Formal Description of Some Linguistic Phenomena in Croatian by Lexical-Functional Grammar (LFG). Zbornik radova Odsjeka za informacijske znanosti. Zagreb: Zavod za informacijske studije Odsjeka za informacijske znanosti Filozofskog fakulteta sveučilišta u Zagrebu, 2002, 119-132

8. Lexical Functional Grammar

9. LFG Demo

10. LFG – Archive Papers

11. LFG – DOP

12. Grammar Writer's Workbench for Lexical Functional Grammar

13. Fortmann, Christian; Forst, Martin. An LFG grammar checker for CALL, In ICALL, 2004.

14. Stefan Riezler, Tracy H. King, Ronald M. Kaplan, Richard S. Crouch, John T. Maxwell III, Mark Johnson: Parsing the Wall Street Journal using a Lexical-Functional Grammar and Discriminative Estimation Techniques. ACL 2002, 271-278

15. K.Owczarzak, J. Genabith, A. Way. Evaluating machine translation with LFG dependencies. Machine Translation , Vol. 21 (2), 2007.

16. Fahime Mohammadpour, Abbas Ali Ahangar, Nader Jahangiri. Building a Hybrid Machine Translation System for Translating. English Linguistics Research, Vol. 1, No. 2; 2012

17. Dalyrmple M., Kaplan R. M., Maxwell III J. T., Zaenen, A., ed: Formal Issues in Lexical-Functional Grammar. Stanford: CSLI, 1995.

Naziv kolegija: Teorija sintaksne analize i primjene

Nastavnik: prof. dr. sc. Zdravko Dovedan Han

ECTS-bodovi: 6

Jezik: hrvatski

Trajanje: jedan semestar (8.)

Status: obavezan za studente jednopredmetnog diplomskog studija informatike, istraživački smjer, izborni za ostale studije

Oblik nastave: 1 sat predavanja - 2 sata seminara - 1 sat vježbi

UvjetiAlgoritmi i strukture podataka i Uvod u formalne jezike i automate

Ispit: pismeni i usmeni

 

Sadržaj

Uvod: temeljni pojmovi teorije formalnih jezika. Uvod u teoriju sintaksne analize:  parsiranje, prepoznavanje. Prepoznavanje regularnih jezika: konačni prepoznavač, regularni izrazi i pretraživanje. Prepoznavači beskontekstnih jezika:  stogovni prepoznavač, prepoznavač s praznim stogom, prošireni stogovni automat, gramatika i ekvivalentni prošireni stogovni automat. Višeprolazno parsiranje: silazna sintaksna analiza, uzlazna sintaksna analiza. Tablični postupci sintaksne: Cocke-Younger-Kasamijev algoritam (CYK),   Earleyjev postupak parsiranja. LL(k) jezici i sintaksna analiza: jezici tipa LL(k), predikatna sintaksna analiza, sintaksna analiza LL(1) jezika. LR(k) jezici i sintaksna analiza: jezici tipa LR(k), LR(0) gramatike i stogovni prepoznavači, sintaksna analiza LR(1)  jezika, gramatike s relacijom prioriteta. Prepoznavač kontekstnih jezika: dvostruko-stogovni prepoznavač, dvostruko-stogovni prepoznavač s jednim stanjem, Turingov stroj. Prepoznavač jezika sa svojstvima: jezici sa svojstvima, prepoznavač jezika sa svojstvima.

 

Sadržaj vježbi

Vježbe slijede predavanja. Sva teorijska razmatranja i definicije upotpunjavaju se odgovarajućim primjerima. Svi se algoritmi implementiraju u jeziku Python.

 

Sadržaj seminara

Rješavanje individualnog projektnog zadatka izradom praktičnog programskog rješenja (parsera ili prepoznavača) u jeziku Python, a za izabrani postupak sintaksne analize. Student predstavlja svoj rad u pisanom obliku i brani ga usmeno pred predmetnim nastavnikom.

 

Opće i specifične kompetencije

Student će dobiti temeljna znanja iz discipline formalnih jezika, posebno sintaksne analize, neophodna za primjenu u identifikaciji ulaznog jezika i definiranju postupka za njegovu sintaksnu analizu.

 

Ishodi učenja

Nakon uspješno savladanog predmeta, student će moći:

1) Definirati pojam sintaksne analize .
2) Modelirati regularni izraze za prepoznavanje regularnih jezika.
3) Provesti istraživanja o efikasnosti postupaka sintaksne analize beskontekstnih jezika.
4) Primijeniti optimalan postupak sintaksne analize.
5) Primijeniti stečena znanja u drugim predmetima studija.

 

Način održavanja nastave

  • Predavanja: kombinirano, klasično (ploča) i prikazom primjera izvedbom na PCu i projiciranjem uz istodobno pisanje primjera programa od strane studenata na svojim računalima.
  • Vježbe: rješavanje postavljenih zadataka i pisanje programa na računalu.
  • Seminar: rješavanje zadanog projektnog (seminarskog) rada uz konzultiranje s predmetnim nastavnikom.

 

Obveze studenata i uvjeti

Obvezno pohađanje nastave (predavanja i vježbi).

 

Način provjere znanja

Praćenje rada i aktivnosti studenata tijekom semestra:

  • pohađanje predavanja – 10 bodova,
  • posebna isticanja na vježbama – do 10 bodova.

Seminarski rad:

  • Obrana seminarskog rada – 80 bodova

Skala ocjena: 
dovoljno (2) 50% - 59%
dobro (3) 60% - 69%
vrlo dobro (4) 70% - 79%
izvrsno (5) 80% - 100%

 

Obavezna literatura

  1. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI  • sintaksna analiza i primjene, Element,  Zagreb, 2012.

 

Preporučena literatura

  1. Aho, V. A.; Ullman, D. J.: The Theory of Parsing, Translation, and Compiling, vol. I: Parsing, 
    Prentice-Hall, 1972.

  2. Dovedan, Z.: FORMALNI JEZICI • sintaksna analiza, Zagreb, ZIS, 2003.
  3. Dovedan Han, Z.: Pascal s tehnikama programiranja (1), VVG, Velika Gorica, 2011.
  4. Dovedan Han, Z.: FORMALNI JEZICI I PREVODIOCI  • regularni izrazi, gramatike, automati, Element,  Zagreb, 2012.
  5. Grune, D.: Parsing Techniques – A Practical Guide, Ellis-Horwood, 1990.
  6. Tomita, M., editor: Current Issues in Parsing Technology, Kluwer Academic Publishers, 1991.
  7. Wirth, N.: Algorithms + Data Structures = Programs, Prentice-Hall, 1976.

Naziv kolegija: Odabrana poglavlja obrade prirodnog jezika

Nastavnici: prof. dr.sc. Nives Mikelić Preradović, doc. dr. sc. Nikola Ljubešić

ECTS bodovi: 5

Jezik: hrvatski

Trajanje: jedan semestar

Status: izborni kolegij

Oblik nastave: 1 sat predavanja, 2 sata seminara

Uvjeti za upis kolegija: nema

 

Ciljevi kolegija:

Automatska izgradnja bilo kojeg resursa prirodnog jezika zahtijeva dobro razumijevanje svojstava tog prirodnog jezika te lingvističkih i statističkih metoda obrade prirodnog jezika. Studenti će usvojiti lingvističke i statističke koncepte koji se koriste u obradi jezika i svladati automatske metode izgradnje primarnih i sekundarnih resursa za hrvatski jezik. Studenti stječu kompetencije, znanja i vještine u primjeni metoda automatske obrade prirodnog jezika te stječu znanje o brojnim temama i sustavima koji se bave različitim problemima obrade hrvatskog i drugih prirodnih jezika.



Očekivani ishodi učenja:

usvajanje znanja o izradi sustava automatskog sažimanje teksta različitim statističkim i lingvističkim metodama, sustava za analizu sentimenta, sustava za prepoznavanje naziva, usvajanje znanja i vještina izrade morfoloških leksikona flektivnih jezika, mrežnih korpusa, itd..

 

Sadržaj kolegija:

Sadržaj predmeta će se mijenjati iz godine u godinu s obzirom na teme obrade prirodnih jezika kojima se iz godine u godinu mijenja važnost.

 

Način polaganja ispita: seminarski rad, praktičan rad, pismeni ispit