Naslovnica

Naziv kolegija: Modeliranje jezika upravljano gramatikama

Predavač: doc.dr.sc. Kristina Kocijan

ECTS bodovi: 6

Status: izborni

Oblik nastave: 1 sat predavanje + 1 sat seminara + 2 sata vježbi

Uvjeti: 'Uvod u obradu prirodnog jezika' i 'Uvod u formalne jezike i automate'

Ispit: pismeni, seminarski, praktični

 

Sadržaj: Uvodne napomene. Automati i pretvarači konačnih stanja. Rekurzivne mreže prijelaza. Regularni izrazi (Perl). Bezokolinske gramatike. Izrada gramatika uz pomoć grafova i pravila (lokalne gramatike, flektivne gramatike, derivacijske gramatike). Leksička analiza. Sintaksna analiza (razdjelnici i parseri). Uklanjanje višeznačnosti. Vrednovanje sustava za analizu. Upiti nad tekstom, konkordancije. Obrada jezika u kontekstu Velikih podataka (Big Data).

 

Ishodi učenja: Nakon uspješnog savladavanja kolegija, studenti će moći: 

  • definirati i prepoznati automate i pretvarače konačnih stanja,
  • definirati, objasniti i oprimjeriti gramatike izrađene uz pomoć pravila i grafova,
  • samostalno izraditi, obrazložiti i primijeniti regularni izraz u Perl-u i NooJ-u,
  • samostalno postaviti jednostavne i složene upite nad tekstom koristeći regularne izraze i grafičke gramatike,
  • samostalno i/ili timskim radom izraditi, obrazložiti i primijeniti gramatiku izrađenu uz pomoć grafova,
  • samostalno i/ili timskim radom izraditi sustav za analizu pisanog teksta na bilo kojem jeziku,
  • valorizirati postojeći ili samostalno izrađen sustav za analizu pisanog teksta.


Literatura:

  1. Steven Abney: Parsing by Chunks, u Principle-Based Parsing,(eds.) R. Berwick, S.Abney, C. Tenny, Kluwer Academic Publishers, 257-278, 1991.
  2. Steven Abney: Partial Parsing via Finite-State Cascades, u Workshop on Robust Parsing, (eds.) J. Carroll, ESSLLI'96, 8-15, 1996.
  3. Steven Abney: Part-of-Speech Tagging and Partial Parsing, u Corpus-Based Methods in Language and Speech, (eds.) K. Church, S. Young, G. Bloothooft, Kluwer Academic Publishers, Dordrecht, 1996.
  4. James Allen: Natural Language Understanding, 2nd edition, The Benjamin Cummings Publishing Company, Inc., Redwood City, 1995. (u knjižnici)
  5. Kenneth R. Beesley, Lauri Karttunen: Finite Morphology, CSLI Publications, Stanford, 2003. (u knjižnici)
  6. John Carroll: Parsing, u The Oxford Handbook of Computational Linguistics, Ruslan Mitkov (ed.), Oxford University Press, Oxford, 233-248, 2003. (u knjižnici)
  7. David Clemenceau: Finite-State Morphology: Inflections and Derivations in a Single Framework Using Dictionaries and Rules, u Finite-State Language Processing, (eds.) E. Roche, Y. Schabes, The MIT Press, London, 67–98, 1997.
  8. Zdravko Dovedan, Formalni jezici: sintaksna analiza, Zavod za informacijske studije, 2003.
  9. Maurice Gross: Local Grammars and their representation by finite automata, u Data, Description, Discourse: Papers on the English Language in honour of John McH sinclair, (ed.) M. Hoey, 26-38, 1993.
  10. Maurice Gross: The Construction of Local Grammars, u Finite-State Language Processing, (eds.) E. Roche, Y. Schabes, MIT Press, London, 329-354, 1997.
  11. Dick Grune, Ceriel Jacobs: Parsing Techniques: A Practical Guide, Ellis Horwood Limited, West Sussex, 1998.
  12. Udo Hahn, Geert Adriaens: Parallel Natural Language Processing: Background and Overview, u Parallel Natural Language Processing, ed. G. Adriaens, U. Hahn, Ablex Publishing Corporation, New Yersey, 1-134, 1994.
  13. James E. Hoard: Language understanding and the emerging alignment of linguistics and natural language processing, u Using Computers in Linguistics: A Practical Guide, (eds) J. Lawler, H. Aristar Dry, Routledge, London, 197-230, 1998. (u knjižnici)
  14. Daniel Jurafsky, James H. Martin: Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Prentice Hall, New Jersey, 2000. (u knjižnici)
  15. Lauri Karttunen: Finite-State Technology, u The Oxford Handbook of Computational Linguistics, Ruslan Mitkov (ed.), Oxford University Press, Oxford, 339-357, 2003. (u knjižnici)
  16. Emmanuel Roche: Parsing with Finite-State Transducers, u Finite-State Language Processing, (eds.) E. Roche, Y. Schabes, The MIT Press, London, 241 – 282, 1997.
  17. Max D.Silberztein:NooJ, 2009.
  18. Atro Voutilainen:Designing a (Finite-State) Parsing Grammar, u Finite-State Language Processing, (eds.) E. Roche, Y. Schabes, The MIT Press, London, 283 – 310, 1997.
  19. Kristina Vučković, Marko Tadić, Zdravko Dovedan:Rule Based Chunker for Croatian, u Proceeding of the Sixth International Conference on Language Resources and Evaluation LREC 2008, Marakeš: ELRA, 2008.
  20. Kristina Vučković, Nives Mikelić Preradović, Zdravko Dovedan: Verb Valency Enhanced Croatian Lexicon, u Proceedings of NooJ 2008, Budimpešta, Mađarska, 2008.