Istoric

Prima etapă în dezvoltarea unui corpus lexicografic românesc electronic a fost realizată în cadrul unui proiect intitulat CLRE. Corpus lexicografic românesc esenţial. 100 de dicţionare din Bibliografia DLR aliniate la nivel de intrare şi la nivel de sens, care a fost finanţat de UEFISCDI, prin instrumentul de finanţare „Proiecte de cercetare pentru stimularea tinerelor echipe independente”, pentru perioada iulie 2010–octombrie 2013 (cod PN-II-RU-TE-2009-1-246).

Echipa de cercetare a fost condusă de CS I dr. Elena Tamba (Dănilă) şi a fost formată din patru membri: specialişti lingvişti (Elena Tamba, Marius-Radu Clim şi Ana-Veronica Catană-Spenchiu) şi un specialist informatician (Marius-Iulian Răschip). Dat fiind volumul mare de lucru pentru partea informatică a proiectului, s-a optat pentru colaborarea cu un voluntar, informatician în formare, Mădălin-Ionel Patraşcu, care, în ultimul an al proiectului, l-a înlocuit pe Marius Răschip. De asemenea, în etapa inițială a proiectului au participat colaboratori externi (doctoranzi, masteranzi postdoctoranzi) la operațiile de validare a informațiilor.

Din 2014, cu titlul CLRE. Corpus lexicografic românesc electronic, a devenit un proiect fundamental al Academiei Române, dezvoltat în cadrul Departamentului de Lexicologie și lexicografie de la Institutul de Filologie Română „Alexandru Philippide” al Academiei Române, Filiala Iași. Acest proiect are ca scop realizarea unei colecții de ediții digitale ale celor mai reprezentative dicționare ale limbii române din toate timpurile, aliniate la nivel de intrare.

Digitalizarea ediției întâi a Dicționarului tezaur editat sub egida Academiei, în manieră CLRE, a fost inițiată într-un proiect UEFISCDI în perioada 2010-2013, în cadrul Institutului de Filologie Română „Alexandru Philippide” al Academiei Române – Filiala Iași (vezi istoric CLRE). CLRE a fost inclus în planul de cercetare al Institutului, ca proiect fundamental, din anul 2014. Începând cu anul 2019, a fost îmbunătățită maniera de prelucrare a imaginilor scanate, a fost reconfigurată metoda de digitalizare și a fost construită o nouă bază de date. Modalitatea actuală de lucru în CLRE presupune, în primul rând, recuperarea tuturor datelor obținute în primele etape ale proiectului, dar și înlocuirea instrumentelor de lucru și reconfigurarea datelor preluate din dicționare. Astfel, a fost creată o interfață de lucru, care permite administrarea paginilor din dicționare, dar și transcrierea cu adnotarea implicită, în care se precizează starea intrărilor și a paginilor (validat sau revizuit), tipul intrărilor (lemă, variantă sau formă flexionară în cazul dicționarelor mai vechi), categoria gramaticală și forma ortografică actuală (pentru dicționarele apărute înainte de 1993). Astfel, se respectă specificul fiecărui dicționar în parte în ceea ce privește alfabetul folosit (chirilic, de tranziție sau latin), literele minuscule sau majuscule, marcarea accentului, dar se oferă utilizatorului și posibilitatea găsirii rapide a unui termen prin alinierea tuturor intrărilor după forma grafică actuală. În plus, interfața de administrare permite o localizare mai precisă în dicționar a articolelor care sunt redate pe mai multe pagini.

Această bază de date este gândită din perspectiva mai largă a creării de dicționare digitale (prin redactare directă ori prin transcriere) într-un format standardizat, specific. De aceea, în acest proces a fost modificat și formatul de adnotare, optându-se pentru TEI (Text Encoding Initiative) un format internațional, foarte flexibil, care permite și alinierea cu resurse lingvistice atât pentru limba română, cât și pentru alte limbi.

Varianta digitală a primei ediții a Dicționarului limbii române (DA / DLR) în maniera CLRE (care presupune posibilitatea căutării după cuvântul-titlu, după prima literă sau după categoriile gramaticale și afișarea în format imagine a paginilor dicționarului) a fost publicată online, cu acces liber, în 2021-2022 (https://dlr1.solirom.ro/).

În mai 2021 a fost publicat online primul volum digitalizat în CLRE: Dicționarul limbii române (DA), Literele A-B, redactat sub egida Academiei Române (publicat inițial în 1913), cuprinzând 8517 intrări.

În mai 2022 a fost publicată integral în CLRE prima ediție digitală anastatică emendată la nivelul cuvântului-titlu și al categoriei lexico-gramaticale a Dicționarului tezaur al limbii române (DA / DLR), cuprinzând cele 39 de volume din prima ediție, cu 155377 de intrări, redactat sub egida Academiei Române (1913–2010).