Proyecto Scripta‎ > ‎

Metodología


1. Selección de textos

1.1 Buscar textos que ofrezcan elementos poco o muy diferenciados en relación con el estándar.

1.2 Selección de textos inéditos y de textos publicados (preferiblemente, la primera edición).

1.3 Selección específica de textos de los géneros que han sido menos representados en la selección inicial.


2. Descripción del proyecto

2. Transcripción de textos: establecimiento de criterios

2.1 Textos transcritos (y publicados)

2.2 Textos inéditos

2.2.1 Textos medievales: aplicación de las normas de edición de «Els Nostres Clàssics»

Separación de palabras.

Apóstrofes y puntos volados según sea necesario.

Guiones o apóstrofes para separar pronombres del verbo.

Regularizamos el uso de u/v y i/j.

2.2.2 Textos a partir del siglo XVII: respecto de la grafía original

2.2.3 Marcas de transcripción

Utilizamos

<> Cuando eliminamos elementos que aparecen en el texto.

[] Cuando añadimos elementos, también dentro de los paréntesis cuadrados anotamos si se trata de elementos marginados, interlineado, rayados en el original.

[...] Cuando no transcribimos porque no lo entendemos o no es legible.

(...) Cuando queremos indicar que el fragmento se ha omitido, que no lo seleccionamos.

(¿) Lectura dudosa

Cursiva Desarrollo de abreviaturas. Si el editor no lo marca, no lo marcamos tampoco.

2.2.4 Tratamiento de las notas

Si son nuestras las numeramos sin ninguna otra marca.

Si son del editor les ponemos un * delante, además de la numeración correspondiente.


3. Informatización del corpus

3.1 Digitalización de los textos

3.2 Aplicación del formato de texto (Word)

3.3 Elaboración de la base de datos técnica (Access)

       Variedad, código, año, siglo, género

       Título del fragmento de texto, nombre del autor

      Referencia bibliográfica completa del texto


4. Códigos de identificación de los textos

Cada texto se ha codificado según los datos del dialecto, el año y el género textual a los que pertenece.

4.1 Codificación del dialecto y el subdialecto

      Balear: Bm (mallorquín), Bme (menorquín), Be (ibicenco)

      Central: C (central), Ct (Campo de Tarragona), Cs (septentrional de transición)

      Rosellonés: R

      Alguerès: A

      Valenciano: V (valenciano), Vs (septentrional), Va (central), Vm (meridional)

      Noroccidental: N (noroccidental), Np (pallarés), Nt (tortosino), N (ribagorzano)

4.2 Codificación del género

Categorización de tipos de texto (según el registro y la temática) a partir de los criterios del Corpus Textual Informatizado de la Lengua Catalana, del IEC (dirigido por Joaquim Rafel), adaptados a las características propias del corpus Scripta.

     1. Narrativa

         1.1 «Rondallística»

     2. Poesía

         2.1 Poesía popular

     3. Teatro

         3.1 Coloquios

         3.2 Investigación literaria

     4. Correspondencia

     5. Filosofía

     6. Religión

         6.1 Sermones

         6.2 Gozos

         6.3 Hagiografía

         6.4 Catequesis

         6.5 Liturgia

         6.6 Edictos, ordenanzas eclesiásticas

         6.7 Profecías

     7. Ciencias Sociales

         7.1 Testamentos

         7.2 Inventarios

         7.3 Textos judiciales

         7.4 Contratos

         7.5 Pregones, edictos, actas, ordenanzas, determinaciones, instancias

         7.6 Libros de cuentas y recibos

         7.7 Enseñanza, urbanidad

         7.8 Otros

     8. Prensa

     9. Ciencias Naturales

         9.1 Meteorología

         9.2 Astronomía, astrología

         9.3 Zoología

         9.4 Botánica

         9.5 Geología

     10 Ciencias aplicadas

         10.1 Medicina

         10.2 Agricultura

         10.3 Náutica

         10.4 Veterinaria

         10.5 Gastronomía

         10.6 Artes y oficios (construcción…)

         10.7 Economía

         10.8 Milicia

     11. Bellas Artes. Diversiones. Juegos. Deportes

     12. Lingüística

         12.1 Lexicografía

         12.2 Gramática

         12.3 Otros (apologías)

         12.4 Onomástica

     13. Historia y geografía

         13.1 Historia

         13.2 Geografía

         13.3 Dietarios

     14. Ciencias puras


4.3 Código identificador del texto

De acuerdo con el año de redacción del texto (real o aproximado si la fecha es desconocida) y con las codificaciones establecidas para los dialectos y los tipos de texto, el tipo de código que identifica los textos es el siguiente:

Dialecto-año-género

Ejemplo: Be-1.560-7.2 (= ibicenco-año 1560-inventarios)


5. Formalización y selección de los datos lingüísticos

5.1 Codificación de los fenómenos fonéticos, morfológicos, sintácticos y léxicos más destacables

5.2 Aplicación de los datos lingüísticos codificados en cada uno de los textos del balear

5.3 Elaboración de códigos estándares para el análisis lingüístico de todos los textos seleccionados


6. Esquema de redacción de los comentarios

6.1 Encabezamiento

       - Dialecto

       - Código del texto

       - Autor: título del texto

6.2 Comentario lingüístico

     a)

         Referencia documental y/o bibliográfica comentada del texto (texto inédito, corrección de un texto publicado, edición, etc.)

         Referencia sobre el autor, cuando el texto no es anónimo

         Contextualización del documento

     b)

         Grafía

         Fonética

         Morfosintaxis

         Léxico

     c)

         Valoración de los datos lingüísticos del texto

6.3 Texto

Reproducción del texto transcrito y digitalizado


7. Glosario

7.1 Marcaje de las formas comentadas

7.2 Indexación del glosario: variante y código de texto