Naziv kolegija: Modeliranje jezika upravljano gramatikama
Predavač: doc.dr.sc. Kristina Kocijan
ECTS bodovi: 6
Status: izborni
Oblik nastave: 1 sat predavanje + 1 sat seminara + 2 sata vježbi
Uvjeti: 'Uvod u obradu prirodnog jezika' i 'Uvod u formalne jezike i automate'
Ispit: pismeni, seminarski, praktični
Sadržaj: Uvodne napomene. Automati i pretvarači konačnih stanja. Rekurzivne mreže prijelaza. Regularni izrazi (Perl). Bezokolinske gramatike. Izrada gramatika uz pomoć grafova i pravila (lokalne gramatike, flektivne gramatike, derivacijske gramatike). Leksička analiza. Sintaksna analiza (razdjelnici i parseri). Uklanjanje višeznačnosti. Vrednovanje sustava za analizu. Upiti nad tekstom, konkordancije. Obrada jezika u kontekstu Velikih podataka (Big Data).
Ishodi učenja: Nakon uspješnog savladavanja kolegija, studenti će moći:
- definirati i prepoznati automate i pretvarače konačnih stanja,
- definirati, objasniti i oprimjeriti gramatike izrađene uz pomoć pravila i grafova,
- samostalno izraditi, obrazložiti i primijeniti regularni izraz u Perl-u i NooJ-u,
- samostalno postaviti jednostavne i složene upite nad tekstom koristeći regularne izraze i grafičke gramatike,
- samostalno i/ili timskim radom izraditi, obrazložiti i primijeniti gramatiku izrađenu uz pomoć grafova,
- samostalno i/ili timskim radom izraditi sustav za analizu pisanog teksta na bilo kojem jeziku,
- valorizirati postojeći ili samostalno izrađen sustav za analizu pisanog teksta.
Literatura:
- Steven Abney: Parsing by Chunks, u Principle-Based Parsing,(eds.) R. Berwick, S.Abney, C. Tenny, Kluwer Academic Publishers, 257-278, 1991.
- Steven Abney: Partial Parsing via Finite-State Cascades, u Workshop on Robust Parsing, (eds.) J. Carroll, ESSLLI'96, 8-15, 1996.
- Steven Abney: Part-of-Speech Tagging and Partial Parsing, u Corpus-Based Methods in Language and Speech, (eds.) K. Church, S. Young, G. Bloothooft, Kluwer Academic Publishers, Dordrecht, 1996.
- James Allen: Natural Language Understanding, 2nd edition, The Benjamin Cummings Publishing Company, Inc., Redwood City, 1995. (u knjižnici)
- Kenneth R. Beesley, Lauri Karttunen: Finite Morphology, CSLI Publications, Stanford, 2003. (u knjižnici)
- John Carroll: Parsing, u The Oxford Handbook of Computational Linguistics, Ruslan Mitkov (ed.), Oxford University Press, Oxford, 233-248, 2003. (u knjižnici)
- David Clemenceau: Finite-State Morphology: Inflections and Derivations in a Single Framework Using Dictionaries and Rules, u Finite-State Language Processing, (eds.) E. Roche, Y. Schabes, The MIT Press, London, 67–98, 1997.
- Zdravko Dovedan, Formalni jezici: sintaksna analiza, Zavod za informacijske studije, 2003.
- Maurice Gross: Local Grammars and their representation by finite automata, u Data, Description, Discourse: Papers on the English Language in honour of John McH sinclair, (ed.) M. Hoey, 26-38, 1993.
- Maurice Gross: The Construction of Local Grammars, u Finite-State Language Processing, (eds.) E. Roche, Y. Schabes, MIT Press, London, 329-354, 1997.
- Dick Grune, Ceriel Jacobs: Parsing Techniques: A Practical Guide, Ellis Horwood Limited, West Sussex, 1998.
- Udo Hahn, Geert Adriaens: Parallel Natural Language Processing: Background and Overview, u Parallel Natural Language Processing, ed. G. Adriaens, U. Hahn, Ablex Publishing Corporation, New Yersey, 1-134, 1994.
- James E. Hoard: Language understanding and the emerging alignment of linguistics and natural language processing, u Using Computers in Linguistics: A Practical Guide, (eds) J. Lawler, H. Aristar Dry, Routledge, London, 197-230, 1998. (u knjižnici)
- Daniel Jurafsky, James H. Martin: Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Prentice Hall, New Jersey, 2000. (u knjižnici)
- Lauri Karttunen: Finite-State Technology, u The Oxford Handbook of Computational Linguistics, Ruslan Mitkov (ed.), Oxford University Press, Oxford, 339-357, 2003. (u knjižnici)
- Emmanuel Roche: Parsing with Finite-State Transducers, u Finite-State Language Processing, (eds.) E. Roche, Y. Schabes, The MIT Press, London, 241 – 282, 1997.
- Max D.Silberztein:NooJ, 2009.
- Atro Voutilainen:Designing a (Finite-State) Parsing Grammar, u Finite-State Language Processing, (eds.) E. Roche, Y. Schabes, The MIT Press, London, 283 – 310, 1997.
- Kristina Vučković, Marko Tadić, Zdravko Dovedan:Rule Based Chunker for Croatian, u Proceeding of the Sixth International Conference on Language Resources and Evaluation LREC 2008, Marakeš: ELRA, 2008.
- Kristina Vučković, Nives Mikelić Preradović, Zdravko Dovedan: Verb Valency Enhanced Croatian Lexicon, u Proceedings of NooJ 2008, Budimpešta, Mađarska, 2008.