Wortart | DRAE | Korpus |
---|---|---|
Substantive | 61 % | 55 % |
Verben | 14 % | 19 % |
Adjektive | 28 % | 19 % |
Adverbien | 3 % | 6 % |
gesamt | ~ 90.000 | ~ 30.000 |
Wortart | Lemmata im DRAE | Tokens im DRAE |
---|---|---|
Substantive | 77 % | 98 % |
Verben | 69 % | 98 % |
Adjektive | 79 % | 96 % |
Adverbien | 48 % | 92 % |
gesamt | 74 % | 97 % |
Typ | Beispiele | Lemmata | Tokens |
---|---|---|---|
Wort mit historischer Schreibung | á, fué, habia, luégo, oir | 22 | 6.871 |
Komplexe Form | a cada paso, hacer cargo, pues bien, tal vez, tomar parte | 49 | 3.851 |
Zahl | 1, 2, 3, 4 | 5 | 2.270 |
Lemmatisierung | acurrucar, bajito, milicos, prostituta, pulperías | 12 | 538 |
mündlicher Ausdruck | ju ju, pa, usté, verdá | 4 | 350 |
Anredeform | donna, misia, ño, pae, señá | 5 | 267 |
Historische Form | díjole, púsose | 2 | 71 |
Derivation | apresuradamente | 1 | 36 |
gesamt | 100 | 14.254 |
Analyse der häufigsten Wörter, die nicht im DRAE vorkommen, zeigt eher Besonderheiten der Daten und Interdependenzen zwischen NLP-Werkzeugen und dem Wörterbuch auf als stilistische Besonderheiten der Romantexte.
Ergebnisse, die auch in sprach- und literaturwissenschaftlicher Hinsicht interessant sind?
Typ | Beispiele | Lemmata | Tokens |
---|---|---|---|
Fremdwörter | aurum, my lord, robe-de-chambre, rotissérie, spleen | 11 | 12 |
Derivation | desprecavidamente, enchalecar, fisionómico, mediumnidad, pesquisante | 15 | 17 |
Komposition | ante-marcial, antero-posterior, semiconvicción, semi espontáneo | 4 | 5 |
Fachvokabular | faquirismo, filodendro, fosfóreo, giratriz, soporífico | 8 | 8 |
Neologismen | etmóidues, paralelipípedo | 2 | 2 |
Typ | Beispiele | Lemmata | Tokens |
---|---|---|---|
Diminutive | arroyuelo, carita, golpecito, nubecilla, pequeñín | 44 | 60 |
Augmentative | bigardón, caseretón, ricachón | 5 | 5 |
Fremdwörter | champagne, esprit, highlife, kummel, nobis | 31 | 37 |
Derivation | alguacilatos, aportuguesada, barbacanesca, enarcamiento, noticierismo | 22 | 28 |
Komposition | autoconfesión, neosegundo, semisueño, ultrarrefinado, verdiblanco | 14 | 15 |
Fachvokabular | cabrifollo, genitriz, lamanisco, literalismo, psicalgia | 9 | 11 |
Umgangssprache | hecho añicos, miquitrefe, pillete, pilluelo, piperete | 7 | 13 |
Welche der Wörter aus den Romanen, die in DRAE enthalten sind, gelten als:
Typ | Beispiele | Lemmata | % | Tokens | % |
---|---|---|---|---|---|
veraltet | despabilar, marchante, melecina, tropelía, vaivenear | 2.023 | 6,50 | 228.148 | 22,76 |
dialektal | abastar, abonar, apegar, cunero, fierro | 5 | 0,02 | 67 | 0,007 |
umgangssprachlich | asnal, baboso, curro, pajarraco, regordete | 2.477 | 7,96 | 220.732 | 22,02 |
Spanien | achuchar, marrón, pirrar, talego, zagal | 96 | 0,31 | 5.041 | 0,50 |
Amerika | botarate, bronca, caudillaje, gallero, milico | 248 | 0,77 | 25.361 | 2,53 |
Argentinien | endenantes, fifí, mate, palangana, viborear | 739 | 2,35 | 38.930 | 3,88 |
Folien unter: https://hennyu.github.io/koll_rom_18/
CLiGS: http://cligs.hypotheses.de/
Textbox: https://github.com/cligs/textbox/