Mai mulţi cercetători români au lansat un model dedicat limbii române pentru inteligenţa artificială de tip ChatGPT

O echipă de cercetători români a creat un model de limbaj (LLM – „large language model”) dedicat limbii române, ce poate fi folosit pentru dezvoltarea unor unelte şi platforme A.I. Modelul este „open source”, deci va putea fi accesat şi folosit de oricine doreşte să construiască instrumente bazate pe inteligenţa artificială.

Odată cu publicarea acestui LLM, iniţiatorii proiectului lansează şi comunitatea OpenLLM-Ro, care doreşte să-i aducă împreună pe toţi cei care vor să contribuie în diverse forme la dezvoltarea tehnologiilor A.I. pentru limba română. Ambele proiecte sunt iniţiate şi derulate de către POLITEHNICA Bucureşti, Universitatea din Bucureşti şi Institutul de Logica şi Ştiinţa Datelor, cu sprijinul BRD Groupe Société Générale.

Deşi este o tehnologie la care avem acces la scară largă de doar câţiva ani, mulţi dintre noi am interacţionat deja de foarte multe ori cu roboţi conversaţionali, precum ChatGPT (produs de OpenAI), Copilot (dezvoltat de Microsoft), Gemini (dezvoltat de Google) etc. Însă, pentru limba română rezultatele sunt uneori imprecise, pentru că modelele pe care sunt instruite nu au fost expuse multor surse româneşti de date. Totodată, aceste genuri de unelte nu pot fi folosite în companii, deoarece accesul direct poate fi restricţionat din raţiuni de securitate şi confidenţialitate.

Dezvoltatorii modelului open source consideră că o soluţie în aceste situaţii este implementarea unui model local aflat în infrastructura companiei. Aceste modele publice care pot fi folosite local sunt în general, însă, antrenate pe limba engleză sau folosind un număr redus de documente în limbile cu circulaţie mai scăzută.

Modelul românesc lansat este adaptarea unui LLM public dezvoltat în principal pentru limba engleză. Însă acesta a fost expus la câteva milioane de documente în limba română, pentru a înţelege mai bine semnificaţia cuvintelor. Acest lucru e esenţial pentru perfomanţa unor astfel de modele în situaţii unde exprimarea cerinţei sau a întrebării introduse de utilizator, cât şi a răspunsului trebuie să fie în limba română.

Începând din a doua parte a anului 2023, la dezvoltarea şi instruirea acestui LLM a lucrat o echipă de cercetători de la POLITEHNICA Bucureşti, Universitatea din Bucureşti şi Institutul de Logica şi Ştiinţa Datelor. Partenerii academici au contribuit cu cercetători care au lucrat pro-bono şi, în plus, POLITEHNICA Bucureşti a pus la dispoziţie şi puterea de calcul necesară antrenării modelului. Partenerul principal al proiectului este BRD Groupe Société Générale.

„Câteva dintre exemplele de utilizare ale modelului românesc sunt: căutarea de informaţii în baza de cunoştinţe a unei organizaţii, cu ghiduri şi proceduri de lucru, sau roboţi conversaţionali pentru clienţii companiilor sau ai instituţiilor care să îi ghideze în parcurgerea paşilor necesari pentru utilizarea unui produs sau serviciu. În ambele cazuri, angajaţii şi/sau clienţii economisesc timp în accesarea informaţiei, beneficiind în multe situaţii şi de îmbunătăţirea calităţii acesteia”, a spus Alin Ştefănescu, directorul Departamentului de Informatică din cadrul Universităţii din Bucureşti şi vicepreşedintele Institutului de Logică şi Ştiinţa Datelor.