Català · Castellà

projectes vigents

Corpus Informatitzat del Català Antic (CICA)

El Corpus Informatitzat del Català Antic  (CICA) aplega una col·lecció de textos des del segle XI (primers documents de la llengua catalana) fins al segle XVII. Aquests textos estan disposats de tal manera que, gestionats amb el programa de consulta Estació d'Anàlisis Documentals (EAD), desenvolupat al Seminari de Filologia i Informàtica de la Universitat Autònoma de Barcelona, pot facilitar als seus usuaris tot un seguit de  dades i d'informacions útils per a estudis tant de caire  lingüístic com documental.

Una característica diferencial del CICA, i que creiem que és un dels seus mèrits principals, és el fet d'haver estat confeccionat a la mesura de les necessitats d'un projecte concret –la Gramàtica del Català Antic– (encara que això no l’invalida en absolut per a altres projectes) i a partir de la relació constant entre els usuaris del corpus i els seus dissenyadors. Aquest vincle ha estat útil tant en la part de selecció i preparació de les obres del corpus –especialment en l'establiment de les normes d'edició–, com en la del disseny de l'arquitectura del programa de consulta.

El CICA no vol ser el "gran corpus" del català antic sinó un "corpus textual i de referència" basat en l'equilibri i la representativitat dels seus components. Equilibri quant a la quantitat de textos i paraules que el componen en cadascun dels apartats dels eixos en què està estructurat el corpus (diacrònic, tipològic i dialectal); representativitat en tant que els textos seleccionats han de reflectir les característiques lingüístiques dels apartats als quals corresponen.

Les obres que integren el CICA ultrapassen les 400 i aquestes obres aporten al corpus més de 9.000.000 de paraules, majoritàriament catalanes, però, pel fet que el corpus està constituït per textos sencers, també llatines, castellanes, aragoneses, franceses, occitanes, etc. El disseny del CICA, permet que els mots de totes aquestes llengües puguin ser tractats com a corpus independents.