Projecte‎ > ‎

Metodologia

1. Selecció de textos

1.1 Cercar textos que ofereixin elements poc o molt diferenciats en relació amb l’estàndard. 
1.2 Selecció de textos inèdits i de textos publicats (preferiblement, la primera edició).
1.3 Selecció específica de textos dels gèneres que han estat menys representats en la selecció inicial.

2. Descripció del projecte

2. Transcripció de textos: establiment de criteris

2.1 Textos transcrits (i publicats)
2.2 Textos inèdits

2.2.1 Textos medievals: aplicació de les normes d’edició de «Els Nostres Clàssics»

Separació de mots.
Apòstrofs i punts volats segons calgui.
Guionets o apòstrofs per separar pronoms del verb.
Regularitzem l’ús de u/v i i/j.

2.2.2 Textos a partir del segle XVII: respecte de la grafia original

2.2.3 Marques de transcripció

Utilitzem

< > Quan eliminem elements que surten en el text.
[ ] Quan afegim elements, també a dins dels parèntesis quadrats anotem si es tracta d’elements marginats, interliniats, ratllats en l’original.
[...] Quan no transcrivim perquè no ho entenem o no és llegible.
(...) Quan volem indicar que el fragment s’ha omès, que no el seleccionem.
(¿) Lectura dubtosa
Cursiva Desenvolupament d’abreviatures. Si l’editor no ho marca, no ho marquem tampoc.

2.2.4 Tractament de les notes
Si són nostres les numerem sense cap altra marca.
Si són de l’editor els posem un * al davant, a més de la numeració corresponent.

3. Informatització del corpus

3.1 Digitalització dels textos
3.2 Aplicació del format de text (Word)
3.3 Elaboració de la base de dades tècnica (Access)
      
 Varietat, codi, any, segle, gènere
      
 Títol del fragment de text, nom de l’autor
      
 Referència bibliogràfica completa del text

4. Codis d’identificació dels textos

Cada text s’ha codificat segons les dades del dialecte, l’any i el gènere textual als quals pertany.

4.1 Codificació del dialecte i el subdialecte

     — Balear: Bm (mallorquí), Bme (menorquí), Be (eivissenc)
     — Central: C (central), Ct (tarragoní), Cs (septentrional de transició)
     — Rossellonès: R
     — Alguerès: A
     — Valencià: V (valencià), Vs (septentrional), Va (apitxat), Vm (meridional)
     — Nord-occidental: N (nord-occidental), Np (pallarès), Nt (tortosí), Nr (ribagorçà)

4.2 Codificació del gènere

Categorització de tipus de text (segons el registre i la temàtica) a partir dels criteris del Corpus Textual Informatitzat de la Llengua Catalana, de l’IEC (dirigit per Joaquim Rafel), adaptats a les característiques pròpies del corpus Scripta.

    1. Narrativa
        1.1 Rondallística
    2. Poesia
        2.1 Poesia popular
    3. Teatre
        3.1 Col·loquis
        3.2 Investigació literària
    4. Correspondència
    5. Filosofia
    6. Religió
        6.1 Sermons
        6.2 Goigs
        6.3 Hagiografia
        6.4 Catequesi
        6.5 Litúrgia
        6.6 Edictes, ordinacions eclesiàstiques
        6.7 Profecies
    7. Ciències socials
        7.1 Testaments
        7.2 Inventaris
        7.3 Textos judicials
        7.4 Contractes
        7.5 Pregons, edictes, actes, ordinacions, determinacions, instàncies
        7.6 Llibres de comptes i rebuts
        7.7 Ensenyament, urbanitat
        7.8 Altres
    8. Premsa
    9. Ciències naturals
        9.1 Meteorologia
        9.2 Astronomia, astrologia
        9.3 Zoologia
        9.4 Botànica
        9.5 Geologia
    10 Ciències aplicades
        10.1 Medicina
        10.2 Agricultura
        10.3 Nàutica
        10.4 Veterinària
        10.5 Gastronomia
        10.6 Arts i oficis (construcció...)
        10.7 Economia
        10.8 Milícia
    11. Belles Arts. Divertiments. Jocs. Esports
    12. Lingüística
        12.1 Lexicografia
        12.2 Gramàtica
        12.3 Altres (apologies)
        12.4 Onomàstica
    13. Història i geografia
        13.1 Història
        13.2 Geografia
        13.3 Dietaris
    14. Ciències pures

4.3 Codi identificador del text

D’acord amb l’any de redacció del text (real o aproximat si la data és desconeguda) i amb les codificacions establertes per als dialectes i els tipus de text, el tipus de codi que identifica els textos és el següent:

Dialecte-any-gènere

Exemple:  Be-1560-7.2 (= eivissenc-any 1560-inventaris)


5. Formalització i selecció de les dades lingüístiques

5.1 Codificació dels fenòmens fonètics, morfològics, sintàctics i lexicals més destacables
5.2 Aplicació de les dades lingüístiques codificades en cadascun dels textos del balear
5.3 Elaboració de codis estàndards per a l’anàlisi lingüística de tots els textos seleccionats

6. Esquema de redacció dels comentaris

6.1 Encapçalament
      
 Dialecte     
      
 Codi del text
      
 Autor: títol del text

6.2 Comentari lingüístic
    a)
        
 Referència documental i/o bibliogràfica comentada del text (text inèdit, correcció d’un text publicat,                      edició, etc.)
        
 Referència sobre l’autor, quan el text no és anònim
        
 Contextualització del document

    b)
        
 Grafia
        
 Fonètica
        
 Morfosintaxi
        
 Lèxic

    c)
        
 Valoració de les dades lingüístiques del text

6.3 Text

Reproducció del text transcrit i digitalitzat

7. Glossari

7.1 Marcatge de les formes comentades
7.2 Indexació del glossari: variant i codi de text