Skip to Main Content (Press Enter)

Logo UNITO
  • ×
  • Home
  • Pubblicazioni
  • Progetti
  • Persone
  • Competenze
  • Settori
  • Strutture
  • Terza Missione

UNI-FIND
Logo UNITO

|

UNI-FIND

unito.it
  • ×
  • Home
  • Pubblicazioni
  • Progetti
  • Persone
  • Competenze
  • Settori
  • Strutture
  • Terza Missione
  1. Pubblicazioni

Towards It-CMC: A Fine-Grained POS Tagset for Italian Linguistic Analysis

Contributo in Atti di convegno
Data di Pubblicazione:
2016
Abstract:
Il presente lavoro presenta "It-CMC", un tagset di parti del discorso (PoS) che punta a rappresentare un compromesso tra sostenibilità computazionale e precisione in termini di analisi linguistica. It-CMC nasce da un dataset di dati linguistici italiani provenienti dalla Comunicazione Mediata dal Computer (CMC) e le sezioni di questo lavoro portano avanti un paragone sistematico con l'attuale tagset del corpus "La Repubblica". In seguito a una prima fase di monitoraggio della performance d TreeTagger, il tagset è attualmente al centro di un flusso di lavoro che ha lo scopo di creare un file di parametri di RFTagger.
Tipologia CRIS:
04A-Conference paper in volume
Keywords:
PoS-tagging, Etichettatura Morfosintattica, Fine-grained PoS tagset, Corpora di Italiano, Corpus di Italiano, Analisi Linguistica
Elenco autori:
Russo, Claudio
Link alla scheda completa:
https://iris.unito.it/handle/2318/1620281
Titolo del libro:
Text, Speech, and Dialogue
Pubblicato in:
LECTURE NOTES IN COMPUTER SCIENCE
Journal
LECTURE NOTES IN COMPUTER SCIENCE
Series
  • Dati Generali

Dati Generali

URL

http://link.springer.com/chapter/10.1007%2F978-3-319-45510-5_8
  • Utilizzo dei cookie

Realizzato con VIVO | Designed by Cineca | 25.6.1.0