Búsqueda simple
Esta página presenta cinco campos de búsqueda:
- Texto.
- Nivel de instrucción del hablante.
- Sexo del hablante.
- Edad del hablante.
- Ciudad de procedencia del hablante.
En la parte inicial se observa el número total de intervenciones que existen en el corpus. Este valor se modifica según los criterios de búsqueda aplicados.
Todos los campos, menos el primero, incluyen una lista desplegable de la que puede seleccionarse un único elemento cada vez que se realice una consulta.
El campo Texto es un campo que permite expresiones regulares y permite consultas básicas textuales. Exponemos algunos ejemplos a continuación:
- Búsqueda de cadena de texto. Si se busca que los resultados incluirán la palabra que, pero también otros resultados como queriendo, queso, dique, etc.
- Búsqueda de palabra simple. Si se busca exactamente la palabra que, puede buscarse añadiendo un espacio en blanco antes y después de la palabra.
- Búsqueda de palabras al inicio del grupo entonativo: .*: que
- Búsqueda de palabras al final del grupo entonativo: que$
- Búsqueda de palabras que constituyan un único grupo entonativo: .*: sí$
Búsqueda con datos fónicos o por forma
Para buscar de manera más precisa por palabras, etiquetas morfológicas e incluso para visualizar datos fónicos, acceda a Oralstats Aroca (Cabedo y Carcelén 2022), la plataforma gratuita para consulta de corpus orales que permite realizar una minería de datos fónicos y morfológicos del corpus Ameresco.
Enlace: https://adrin-cabedo.shinyapps.io/aroca_viewer/
El etiquetado morfológico automático del corpus se ha realizado con el etiquetador gratuito UdPipe.
Otras búsquedas más complejas
En caso de que el investigador requiera de alguna búsqueda más compleja, puede descargar el corpus entero en la sección de Archivos. Allí podrá encontrar los archivos del corpus en formato de Elan, Textgrid y una transcripción conversacional en formato de texto plano; el programa ELAN ya facilita búsquedas complejas, pero también puede transformar los datos según sus propios intereses particulares, dado que el formato de este programa es un XML. Otra opción que puede realizar el investigador es descargar las transcripciones en el formato que desee y utilizar otros programas accesibles en el mercado: Wordsmith, Antconc, atlas.ti...
Por otro lado, nuestros datos están almacenados en una base de datos MYSQL; si tiene conocimientos de bases de datos relacionales, puede indicarnos cuál es la búsqueda concreta que desea realizar.