Mai Magyar Beszélt Nyelvi Adatbázis

Vezető: 
Dr. Gácsi-Iványi Zsuzsanna, egyetemi docens
Tagok: 
Mezei Zsuzsa Lívia, tudományos segédmunkatárs
Tagok: 
Pethő Gergely, tudományos segédmunkatárs
Tagok: 
Baráth Ágnes, adatkezelő
Tagok: 
Marinecz Kornélia Florina, középiskolai tanár
Tagok: 
Thomas Erika, doktorhallgató
Tagok: 
Dr. Jirí Pilarsky, egyetemi docens
Tagok: 
Dr. Sajgál Mónika, egyetemi tanársegéd
Tagok: 
Pappné Forgács Edit, középiskolai tanár

Mai Magyar Beszélt Nyelvi Adatbázis

Kutatásunk célja a magyar nyelv első digitalizált, beszélt nyelvi, konverzációanalitikai korpuszának felépítése, amely az aktuális szövegtechnológiai szabványoknak megfelelően annotált, XML alapú adatbázis lesz. Korpuszunk a következő három adattípust foglalja magába: 

  1. egy kb. 16 órányi beszélt nyelvi hangfelvételt; 
  2. a konverzáció-elemzés elveinek megfelelően elkészített, GAT rendszer szerinti transzkripciós átiratot; 
  3. az írott nyelvi normának megfelelően átírt, ún. normalizált változatot.

Az így elkészült adatbázis előnye, hogy olyan SQL technológiát használó keresőfelülettel rendelkezik, amelynek segítségével minden benne tárolt információ (pl.: szavak, annotációk) visszakereshető. Ezen kívül lehetővé teszi a keresési találatokhoz a hangfelvétel megfelelő szeletének, ill. meghatározott kiterjedésű kontextusának meghallgatását, s hozzárendeli konverzációanalitikai átiratát is.
Kutatásunk várható eredményei: 

  • az elkészült adatbázis nyílt hozzáférésű publikálása, magyar és angol nyelvű dokumentációval
  • 3 disszertáció / monográfia
  • 4 tanulmány