REINGENIERÍA DE CORPUS EN VENEZUELA: UNA PROPUESTA METODOLÓGICA PARA DIVERSIFICAR EL ANÁLISIS DE LOS CORPUS DEL ESPAÑOL HABLADO EN CARACAS
Resumen
Se propone el término Reingenieria de Corpus para designar el proceso de reconfiguración de muestras de habla que permite su reutilización en diversos ámbitos. El proceso se aplicó a cuatro corpus del español hablado en Caracas con el objetivo de construir dos corpus de propósito especial para análisis diacrónicos. La metodología incluyó los siguientes pasos: i. hacer una memoria cronológica de la construcción de cada muestra; ii. analizar el patrón distribucional de cada arquitectura; iii. determinar los aspectos quebrantados, los sólidos y los puntos de intervención; iv. crear el rediseño y estimar su representatividad. La aplicación de la metodología produjo dos nuevos corpus para el estudio en tiempo real de los fenómenos lingüísticos en comunidades de habla específicas (universitarios jóvenes y hablantes cultos). Se concluye que la Reingeniería de Corpus constituye una práctica provechosa para la Lingüística de Corpus, que proporciona productos útiles e interesantes para la comunidad lingüistica.
Palabras clave
Texto completo:
PDFReferencias
Atkins, S., J. Clear y N. Ostler. (1992). Corpus Design Criteria. Literary and Linguistic Computing, (7, 1), 1-16.
Azorín, D. (coord.). (2002). Alicante corpus oral del español. Alicante: Universidad de Alicante. CD-rom.
Azorín, D. y J. L. Jiménez Ruiz. (1997). Corpus oral de la variedad juvenil universitaria del español hablado en Alicante. Alicante: Instituto de Cultura Juan Gil-Albert.
Barrera Linares, L. (1978). Las áreas dialectales de Venezuela. Letras, (34-35), 18-31.
Bentivoglio, P. (1987). Los sujetos pronominales de primera persona en el habla de Caracas. Caracas: Universidad Central de Venezuela.
Bentivoglio, P. (1998). La variación sociofonológica. Español actual, (69), 29-42.
Bentivoglio, P. e I. Malaver. (2006). La lingüística de corpus en Venezuela: un nuevo proyecto. Lingua Americana, (19), 37-46.
Bentivoglio, P. e I. Malaver. (2012). Corpus sociolingüístico de Caracas: Preseea Caracas 2004-2010. Hablantes de instrucción superior. Boletín de Lingüística, (24), 37-38.
Bentivoglio, P. e I. Malaver. (2014). Corpus sociolingüístico Preseea Caracas 2004-2010. Caracas: UCV-FHE-IFAB. CD-rom.
Bentivoglio, P. y M. Sedano. (1993). “Investigación sociolingüística: sus métodos aplicados a una experiencia venezolana”. Boletín de Lingüística (8), 3-35.
Bentivoglio, P., K. Guirado e I. Malaver. (2014). Marcadores del discurso de Caracas. En A. Valencia Espinoza (coord.). Marcadores discursivos en la norma culta hispánica: 1964-2014. Cuadernos del ALFAL, (5), 43-68. Disponible en http://www.dialogoseducativos.cl/revista/papeldigital/.
Briz Gómez, A. y M. Albelda Marco. (2009). Estado actual de los corpus de lengua española hablada y escrita: I+D. El español en el mundo. Anuario del Instituto Cervantes, 165-226. .
Camacho, M. (2011). Análisis pragmático de los apelativos empleados por jóvenes universitarios en el español de Costa Rica. Tesis de Maestría. Universidad de Costa Rica, Costa Rica.
Centeno de Figueroa, A. B. (1990). Perfil socioeconómico de los recursos humanos de nivel educativo superior en Venezuela: Década de los 80. Informe de Investigaciones Educativas (IV, 1-2), 83-104.
Cepeda, G. y A. Barrientos. (1989). El habla juvenil de Valdivia. Entrevistas informales. Valdivia: Central de Publicaciones de la Universidad Austral de Chile.
Contasti, M. (1980). Metodología para la medición del nivel socio-económico para la población venezolana. Boletín de la AVEPSO (3, 2), 13-17.
De Stefano, L. y L. Pérez Arreaza. (2000). Estudio histórico del español de Venezuela: recolección del corpus y rasgos lingüísticos más resaltantes de los documentos. Lingua Americana (7), 5-22.
Delgado, M. (2005). Crecimiento de la población y proceso de urbanización en el Distrito Metropolitano de Caracas: efectos ambientales. En A. Freitez, M. Di Brienza, G. Zúñiga, R. Carvallo, M. Phélan y T. García (eds.). Cambio demográfico y desigualdad social en Venezuela al inicio del tercer milenio. II Encuentro Nacional de Demógrafos y Estudiosos de la Población, 197-212. Caracas: AVEPO.
Francis, W. N. (1979). Problems of assembling and computerizing large corpora. En H. Bergenholtz y B. Schaeder (eds.). Empirische Sprachwissenschaft. Aufbau und Auswertung von Text-Corpora, 110-123. Konigstein/Ts.: Scriptor.
Gallucci, Mª. J. (2005). El número de palabras: un nuevo criterio para describir tres corpus del habla de Caracas. Boletín de Lingüística (24), 108-121.
García, N. (2004). Diferentes, desiguales y desconectados. Mapas de la interculturalidad. Barcelona: Gedisa.
Guirado, K. (2011). Allá yo vivía pa’ estudiar: Un estudio de variación en el habla de jóvenes universitarios caraqueños. Boletín de Lingüística (35-36), 57-80. En línea: http://saber.ucv.ve/ojs/index.php/rev_bl/article/view/2682/2572.
Guirado, K. (2015). Marcadores discursivos de Caracas. En A. Valencia y A. Vigueras (coords.), Más sobre marcadores hispánicos: Usos de España y América en el corpus de estudio de la norma culta. México D.F.: UNAM. [en prensa]
Granda, G. de (1994). Observaciones metodologicas sobre la investigacion sociolingüistica en hispanoamerica. Lexis (XVIII, 2), 197-210.
Herrera, J. (1994-95). Estudio sociolingüístico de los relativos en el español de Santa Cruz de Tenerife. Tesis doctoral. Universidad de la Laguna, España. .
Instituto Nacional de Estadística. INE. Instituto Nacional de Estadística. .
Labov, W. (1972). Sociolinguistic patterns. Philadelphia: University of Pennsylvania Press.
Lope, J. (1987). El Estudio Coordinado de la Norma Culta de las Principales Ciudades de Lengua Española. Actas del VII Congreso. Asociación de Lingüística y Filología de América Latina (ALFAL) I, 163-67. Santo Domingo: Asociación de Lingüística y Filología de América Latina.
McEnery, T. (2003). Corpus Linguistics. En R. Mitkov (ed.). The Oxford Handbook of Computational Linguistics, 448-463.. Oxford: Oxford University Press.
McEnery, T. y A. Wilson (1996). Corpus linguistics. Edinburgh: Edinburgh University Press.
McEnery, T., R. Xiao y Y. Tono (2006). Corpus-Based Language Studies. An advanced resource book. London y New York: Routledge.
Moreno, F. (1996). Metodología del ‘Proyecto para el estudio sociolingüístico del Español de España y de América’ (PRESEEA). Lingüística (8), 257-287.
Moreno, F. (1997). Metodología del «Proyecto para el Estudio Sociolingüístico del Español de España y América». Trabajos de sociolingüística hispánica, 137-161. Alcalá de Henares: Universidad de Alcalá.
Moreno, F. (2005a). Corpus para el estudio del español en su variación geográfica y social. El corpus «PRESEEA». Oralia (8), 123-139.
Moreno, F. (2005b). Principios de sociolingüística y sociología del lenguaje. Barcelona: Ariel.
Morill, M. (2007). El sistema educativo y el trabajo en Venezuela. Saber (19, 2). .
Osuna, Z. (2007). Boletín de indicadores de Educación Superior 1. 2000-2005. Caracas: MPPES. CNU. OPSU.
Parodi, G. (2008). Lingüística de corpus: una introducción al ámbito. Revista de lingüística teórica y aplicada (46, 1), 93-119.
Pearson, J. (1998). Terms in Context. Studies in Corpus Linguistics 1. Amsterdam/Philadelphia: John Benjamins.
Pérez, C. y A. M. Ortiz. (2009). Lingüística Computacional y Lingüística de Corpus. Potencialidades para la investigación textual. En N. Rodríguez Ortega (dir.). Teoría y literatura artística en la sociedad digital: construcción y aplicabilidad de colecciones textuales informatizadas, 67-96. Gijón: TREA.
Pérez, F. (1997). Instituto de Filología Andrés Bello de la UCV. 50 Aniversario en homenaje a Ángel Rosenblat. El ucabista (22). .
Ponce, M. (2010). La diversidad de la pobreza en Venezuela: desarrollo urbano, educación y trabajo. 2003-2005. Revista Venezolana de Análisis de Coyuntura (XVI, 1), 77-109.
Proyecto para el estudio sociolingüístico del Español de España y de América (PRESEEA). PRESEEA. Proyecto para el estudio sociolingüístico del Español de España y de América. .
Rabanales, A. (1992). Fundamentos teóricos y pragmáticos del «Proyecto de estudio coordinado de la norma lingüística culta del español hablado en las principales ciudades del mundo hispánico». Boletín de Filología (XXXIII), 251-72.
Real Academia Española. Real Academia Española. Banco de datos. CREA. .
Registro Nacional Voz de los Creadores. Catálogo I. Antropología y Lingüística. Paola Bentivoglio. Fundación Casa del Artista: Caracas.
Reyes, I. (ed.) (2001). El habla culta de la generación joven de La Habana, Cuba. Materiales para su estudio. Tomos I-III. San Juan: Universidad de Puerto Rico.
Rodríguez, F. (2002). Lenguaje y contracultura juvenil: anatomía de una generación. En F. Rodríguez G. (coord.). El lenguaje de los jóvenes, 29-56. Barcelona: Ariel.
Rosenblat, Á. (2002). El español de América. Caracas: Fundación Ayacucho.
Rosenblat, Á. (dir.) y P. Bentivoglio (ed.) (1979). El habla culta de Caracas. Materiales para su estudio. Caracas: Facultad de Humanidades y Educación, Universidad Central de Venezuela.
Samper, J., C. E. Hernández Padilla y M. Troya Déniz (1998). Macrocorpus de la norma lingüística culta de las principales ciudades del mundo hispánico. Las Palmas de Gran Canaria: Universidad de Las Palmas de Gran Canaria. Disco compacto.
Sánchez, A. (1995). Definición e historia de los corpus. En A. Sánchez, R. Sarmiento, P. Cantos y J. S. (eds.). CUMBRE-Corpus Lingüístico de Español Contemporáneo: fundamentos, metodología y aplicaciones, 7-24. Madrid: SGEL.
Santalla del Río, Mª. P. (2005). La elaboración de corpus lingüísticos. En M. Cal, P. Núñez e I. M. Palacios (eds.). Nuevas tecnologías en Lingüística, Traducción y Enseñanza de lenguas, 45-63. Santiago de Compostela: Universidad de Santiago de Compostela.
Sedano, M., A. Bolívar y M. Shiro (comp.) (2006). Haciendo lingüística. Homenaje a Paola Bentivoglio. Caracas: Comisión de Estudios de Postgrado. Facultad de Humanidades y Educación. Universidad Central de Venezuela.
Shiro, M. (1998). Los pequeños cuentacuentos. El desarrollo de las habilidades narrativas de niños en edad escolar. Trabajo de ascenso. Universidad Central de Venezuela, Venezuela.
Silva-Corvalán, C. (2001). Sociolingüística y pragmática del español. Washington, D.C.: Georgetown University Press.
Sinclair, J. (1996). Preliminary recommendations on Corpus Typology. EAG-TCWG-CTYP/P. En EAGLES. .
Sinclair, J. (2005). Corpus and text - basic principles”. En M. Wynne (ed.). Developing linguistic corpora: A guide to good practice, 1-16. Oxford: Oxbow Books. .
Tejera, M. (dir.) (1993). Diccionario de Venezolanismos I, II y III. Caracas: Universidad Central de Venezuela, Academia Venezolana de la Lengua, Fundación Edmundo y Hilde Scnoegass.
Tejera, M. y L. de Stefano (2006). Documentos para la historia del español de Venezuela - Siglos XVI-XVIII. Caracas: Fondo Editorial de Humanidades y Educación, Universidad Central de Venezuela. Disco compacto.
Torruella, J. y J. Llisterri (1999). Diseño de corpus textuales y orales. En J. M. Blecua, G. Clavería, C. Sánchez y J. Torruella (eds.). Filología e informática. Nuevas tecnologías en los estudios filológicos, 45-77. Barcelona: Milenio. .
Valencia, A. (coord.) (2014). Marcadores discursivos en la norma culta hispánica: 1964-2014. Cuadernos del ALFAL 5. .
Copyright (c) 2017 LETRAS
Actualmente alojada en https://revistas.upel.edu.ve/index.php/letras/index
LETRAS es una revista de Acceso Abierto y está bajo una
- Creative Commons Atribución-NoComercial-CompartirIgual 4.0
- ISSN impreso: 0459-1283
- ISSN en línea: 2791-1179
- Edición: dos números al año.
Instituto Venezolano de Investigaciones Lingüísticas y Literarias "Andrés Bello" Universidad Pedagógica Experimental Libertador. Instituto Pedagógico de Caracas, Edificio Histórico, Piso 1, Av. Páez, Urb. El Paraíso. Código postal 1020. Caracas - Venezuela.