Gyakorlati bevezetés a szövegbányászatba (R-ben)

Időpont

2019. január 29.

Oktató

Dr. Sebők Miklós, tudományos főmunkatárs, MTA TK, a POLTEXT szövegbányászati projekt(poltext.tk.mta.hu) kutatásvezetője

Leírás

Az egy napos kurzus gyakorlati bevezetést nyújt a szövegbányászat gyakorlatába és az elemi kvantitatívszövegelemzési feladatok elvégzéséhez nélkülözhetetlen elméleti alapokba. A hangsúly a feladatok megfelelőbemutatásán és az elérhetővé tett programok felhasználásával történő megoldásán van.

Tervezett menetrend

9:00-10:30 – Bányásszunk szöveget! A szöveg mint adat. A szózsák-módszer és a DTM.

10:30-10:45 – KÁVÉSZÜNET

10:45-12:00 – Alapvető eljárások: névelem-felismerés, érzelem-felismerés, egyéb szótár-alapúmegoldások

12:00-13:00 – EBÉDSZÜNET

13:00-14:15 – Osztályozás: Felügyelt gépi tanulás

14:15-14:30 – KÁVÉSZÜNET

14:30-15:45 – Csoportosítás: Felügyelet nélküli gépi tanulás

15:45-16:15 – További kérdések, alkalmazási lehetőségek

Irodalom

  • Aggarwal, C. C. (szerk.) Mining Text Data. Springer, 2012.
  • Robinson – Silge: Text Mining with R: A Tidy Approach. O’Reilly, 2017.
  • Sebők M. (szerk.) Kvantitatív szövegelemzés és szövegbányászat a politikatudományban.L’Harmattan, 2016.