Condivisione del corpus di italiano parlato TIGR: un caso studio ORD

Condivisione del corpus di italiano parlato TIGR:
un caso studio ORD

Dagli anni 1990 in poi, per lo studio dell'italiano parlato diversi corpora sono stati costruiti e in parte resi accessibili su siti web e DVD. Il corpus d'italiano parlato TIGR, che è stato raccolto nel quadro del progetto InfinIta (sussidio del Fondo Nazionale Svizzero no. 192771) sul territorio della Svizzera italiana negli anni 2021 e 2022, è una risorsa linguistica unica in questo panorama: documenta infatti varietà regionali non contemplate in altri corpora e contiene non solo registrazioni audio, trascrizioni e dati sociolinguistici, ma anche registrazioni video. Lo scopo del progetto ShareTIGR è (a) di condividere questo dataset relativamente ampio (23.5 ore di registrazione, 115 parlanti) con la comunità scientifica, rispettando i principi FAIR e assicurando un'adeguata protezione dei dati; (b) di discutere le varie fasi di questo processo come caso studio che illustra certe pratiche di condivisione degli open research data (ORD) in linguistica, sviluppando i rapporti con le comunità potenzialmente interessante grazie a presentazioni e pubblicazioni scientifiche, un blog di laboratorio e i social media.

Collaborazioni

Institute of Italian Studies
Università della Svizzera italiana
West Campus, Main Building
Via Buffi 13
6900 Lugano, Switzerland
tel +41 58 666 42 95
e-mail [email protected]

Stay in touch

Team

Corpus

Blog

Publications

Contacts

Quicklinks

Share

Print

Stay in touch