Skip to main content

In breve

Dagli anni 1990 in poi, per lo studio dell'italiano parlato diversi corpora sono stati costruiti e in parte resi accessibili su siti web e DVD. Il corpus d'italiano parlato TIGR, che è stato raccolto nel quadro del progetto InfinIta (sussidio del Fondo Nazionale Svizzero no. 192771) sul territorio della Svizzera italiana negli anni 2021 e 2022, è una risorsa linguistica unica in questo panorama: documenta infatti varietà regionali non contemplate in altri corpora e contiene non solo registrazioni audio, trascrizioni e dati sociolinguistici, ma anche registrazioni video. Lo scopo del progetto ShareTIGR è (a) di condividere questo dataset relativamente ampio (23.5 ore di registrazione, 115 parlanti) con la comunità scientifica, rispettando i principi FAIR e assicurando un'adeguata protezione dei dati; (b) di discutere le varie fasi di questo processo come caso studio che illustra certe pratiche di condivisione degli open research data (ORD) in linguistica, sviluppando i rapporti con le comunità potenzialmente interessante grazie a presentazioni e pubblicazioni scientifiche, un blog di laboratorio e i social media.