Naziv kolegija: Mediji i inteligentno pretraživanje teksta

Nositelj: dr. sc. Nives Mikelić Preradović, izv. prof.

Izvođač: dr. sc. Nives Mikelić Preradović, izv. prof.

ECTS-bodovi: 10

Jezik: Hrvatski (engleski po potrebi)

Trajanje: jedan semestar, zimski

Status: izborni kolegij

Cilj kolegija: 

 

Cilj kolegija je pružiti uvid u aktualna istraživanja i metode inteligentnog pretraživanja i obrade tekstualnih informacija. Proliferacijom recenzija, ocjena, preporuka i drugih oblika on-line izražavanja u društvenim medijima, on-line mišljenje se pretvorilo u virtualnu valutu za sve one koji žele promovirati svoje proizvode, identificirati nove mogućnosti i zadržati dobru reputaciju. Automatsko razumijevanje konverzacija u tim medijima i identifikacija relevantnih sadržaja spada pod područje računalne analize stavova i osjećaja. Ključ precizne i pouzdane automatske analize stavova je dobra analiza teksta. Studenti će se na ovom kolegiju upoznati s pristupima toj analizi, pronalaženju relevantih informacija i konačno, metodama automatske analize stavova i osjećaja u medijima.

Sadržaj kolegija:

 

Tekstualne informacije koje nam prenose mediji možemo podijeliti u dvije glavne vrste: činjenice i stavove/mišljenja. Činjenice su objektivne informacije o entitetima, događajima i svojstvima, dok su stavovi uglavnom subjektivne prirode, opisuju osjećaje, pohvale ili kritiku. Većinu postojećih istraživanja u području računalne obrade tekstualnih informacija je usmjerena na pronalaženje činjeničnih informacija, npr. pretraživanje informacija (information retrieval), klasifikaciju teksta (text classification), crpljenje informacija iz teksta (information extraction), automatsko generiranje naslova (headline generation), generiranje sažetka teksta (text summarization), otkrivanje teme teksta (topic detection), itd. No, odnedavno nam računalne aplikacije na Webu koji za društvene medije (blogove, forume, društvene mreže) nude mogućnost automatskog pronalaska mišljenja i stavova korisnika koji u tim medijima daju ocjene proizvoda i usluga, komentiraju događaje ili novinske tekstova, tj. moguće je automatski u tekstu pronaći informacije o stavu i mišljenju (sentiment analysis/opinion mining) društvenih medija. Na ovom kolegiju studenti će dobiti uvid u oba tipa obrade tekstualnih informacija i upoznati se sa sve opsežnijim područjima primjene navedenih računalnih metoda i aplikacija.

Obveze studenata:

Napisati seminarski rad koji će biti oblikovan kao znanstveni rad (na hrvatskom ili engleskom jeziku) u kojem će eksperimentirati s nekoliko sustava za praćenje medija i analizu sentimenta i usporediti njihove rezultate te se osvrnuti na tehnike i pristupe analizi sentimenta o kojima je bilo riječi na predavanju.

 

Obavezna literatura:

1. B. Liu. Sentiment Analysis and Subjectivity. A Chapter in Handbook of Natural Language Processing, 2nd Edition, 2010.  http://www.cs.uic.edu/~liub/FBS/NLP-handbook-sentiment-analysis.pdf

2. Hatzivassiloglou, V. & McKeown, K.      Predicting the Semantic Orientation of Adjectives: http://acl.ldc.upenn.edu/P/P97/P97-1023.pdf

3. Wiebe, J.     Learning Subjective Adjectives from Corpora http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.30.2615&rank=1

4. Turney, P.   Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews http://acl.ldc.upenn.edu/P/P02/P02-1053.pdf

5. Pang, B., Lee, L. & Vaithyanathan, S.      Thumbs up? Sentiment Classification Using Machine Learning http://www.cs.cornell.edu/home/llee/papers/sentiment.pdf

6. Riloff, E., Wiebe, J. & Wilson, T. Learning Subjective Nouns Using Extraction Pattern Bootstrapping http://www.cs.utah.edu/~riloff/pdfs/conll03.pdf

7. Yu, H. & Hatzivassiloglou, V.      Towards Answering Opinion Questions: Separating Facts from Opinions and Identifying the Polarity of Opinion Sentences http://acl.ldc.upenn.edu/W/W03/W03-1017.pdf

8. Kim, S. & Hovy, E.           Automatic Detection of Opinion Bearing Words and Sentences http://acl.ldc.upenn.edu/I/I05/I05-2011.pdf

9. Esuli, A. & Sebastiani, F.   Determining Term Subjectivity and Term Orientation for Opinion Mining http://acl.ldc.upenn.edu/E/E06/E06-1025.pdf

10. Esuli, A. & Sebastiani, F. SentiWordNet: A Publicly Available Lexical Resource for Opinion Mining http://nmis.isti.cnr.it/sebastiani/Publications/LREC06.pdf

11. Suzuki, Y., Takamura, H. & Okumura, M.         Application of Semi-supervised Learning to Evaluative Expression Classification http://www.lr.pi.titech.ac.jp/blogwatcher/paper/cicling2006.pdf

12. Wilson, T., Wiebe, J. & Hoffmann, P.    Recognizing Contextual Polarity in Phrase-Level Sentiment Analysis http://www.cs.pitt.edu/~wiebe/pubs/papers/emnlp05polarity.pdf

13. Andreevskaia, A. & Bergler, S.   Mining WordNet For a Fuzzy Sentiment: Sentiment Tag Extraction From WordNet Glosses http://acl.ldc.upenn.edu/E/E06/E06-1027.pdf

14. Strapparava, C. & Valitutti, A. WordNet-Affect: an Affective Extension of WordNet http://wndomains.fbk.eu/publications/lrec2004.pdf

15. Bobicev, V et al. Emotions in words: developing  a multilingual WordNet-Affect. http://www.sciweavers.org/publications/emotions-words-developing-multilingual-wordnet-affect

16. Devitt A, Ahmad K. Sentiment Polarity Identification in Financial News: A Cohesion-based Approach http://acl.ldc.upenn.edu/P/P07/P07-1124.pdf

Dopunska literatura:

1. Weiss, S.; Indurkhya, N.; Zhang, T.; and Damerau, F. Text Mining: Predictive Methods for Analyzing Unstructured Information. Springer. 2004.

2. Java, A.; Kolari, P.; Finin, T.; Joshi, A.; Martineau, J.; and Mayfield, J.  The BlogVox Opinion Retrieval System. In Proceedings of the Fifteenth Text Retrieval Conference. Washington, DC: National Institute of Standards and Technology. 2007.

3. Pang, B.; Lee, L. Opinion Mining and Sentiment Analysis. Now Publishers Inc. 2008.

4. Wright, A. Mining the Web for Feelings, Not Facts. New York Times. 2009-08-23.

5. Tebbutt, D. Search moves up a notch with emotional feedback". Information World Review. July, 2006.