Skráning og úrvinnsla


Transcriber 1.5
Samtölin voru skráð nákvæmlega í Transcriber umritunarforritinu, en það er franskt forrit sem hægt er að hlaða niður ókeypis. Forritið tengir saman hljóð og texta þannig að hægt sé að leita í gögnunum. Hugbúnaðurinn geymir gögnin á XML formi þannig að hægt sé að meðhöndla þau með ýmiss konar leitar- og greiningarforritum.

Myndin hér til hliðar sýnir forritið og ef smellt er á myndina stækkar hún.




Skráning

Við skráningu á samtölunum var ákveðið að fylgja vinnureglu ÍS-TAL varðandi skráningu talaðs máls til þess að samræmi sé í skráningu gagna talaðs máls.

  1. Allur texti er skráður með venjulegri stafsetningu, þ.e. ekki er hljóðritað.
  2. Skörun og samhliða tal er skráð sérstaklega.
  3. Þagnir eru skráðar en lengd þeirra er ekki mæld.
  4. Ef heyrist ekki hvað sagt er eða skilst ekki þá er það skráð sérstaklega.
  5. Ef orð heyrast alls ekki þá er það skráð sérstaklega.
  6. Ef ófullgerð orð eru sögð þá er það skráð.
  7. Hikorð eru skráð fullum fetum.
  8. Umhverfishljóð eru skráð þ.e. hurðaskellir, símhringingar o.fl. Líkamshljóð eru skráð eins og hlátur, ræsking, hósti o.fl.
  9. Raddbreytingar þ.e. andvarp eða hvísl er skráð.

Að lokinni skráningu hafa öll samtölin verið vistuð á DVD geisladisk sem geymir bæði textaskrá og hljóðskrá ásamt öðrum gögnum. Frágangur á upplýsingum tengdum upptökum og vinnu við skráningu voru sett saman, þ.e. skráningarblöð varðandi aldur málhafa, lengd upptöku, menntun málhafa og staðsetningu voru sett saman í töflu til að auðvelda úrlestur gagnanna. Allir málhafar gáfu samþykki sitt fyrir því að gögnin yrðu notuð til áframhaldandi rannsókna á íslenskri tungu og eru þessi samtöl því ómetanleg fyrir framtíðarrannsóknir.