„Ș românesc” versus „Ş turcesc”

Sau cum lipsa de implicare a autorităților a transformat România într-o „Abramburică a diacriticelor”

Academia Română a stabilit – cu întârziere remarcabilă (desigur în sens negativ) abia în 2003 – că reprezentarea grafică corectă a caracterelor ș/Ș, ț/Ț se face prin adăugarea virgulei sub caracterele s/S, t/T.

Din păcate, la acea oră o cu totul altă reprezentare („ş” și „ţ” cu sedilă/„seceră”, „turcești”, exact cum le folosesc eu, în articol,- în mod greșit!, dar nu am ce face – vezi mai jos /notă ulterioară: am reușit, între timp, să instalez driverele corecte pentru ș, ț și am revenit, editând articolul și corectând formele ș, ț în cele corecte) era deja „consacrată” în domeniul calculatoarelor, iar o corectare deplină sau măcar satisfăcătoare a situației s-a dovedit și se dovedește imposibilă, chiar 10 ani mai târziu (și personal nu sunt deloc optimist nici asupra perspectivelor următorilor 10 ani!), în ciuda consecințelor grave pe care această ambiguitate – descrisă pe larg mai jos – o are în ce privește scrierea corectă a limbii române – în forma sa „electronică” – sau asupra folosirii numelor de domenii ce includ diacritice românești.

Factorii care au condus la această ambiguitate – incredibilă pentru lumea atât de logică și organizată a calculatoarelor – sunt patru la număr, în opinia mea.

1) existența a două codări STANDARD internaționale pentru „ș” și „ț”

  •  ISO/IEC 8859-2:1998 (Latin2) – reprezintă „ș” și „ț” prin „s cu sedilă (dedesubt)”, respectiv „t cu sedilă (dedesubt)” – UNICODE U015E, U015F (Ș, respectiv ș), U0162, U0163 (Ţ, ţ)
  • apariția standardului românesc SR 13411:1999 a condus la adoptarea unui alt standard internațional – ISO/IEC 8859-16:2001 (Latin10) – care reprezintă corect, de această dată, caractele „ș” și „ț”, prin „s cu virgulă dedesubt” (UNICODE U0218 – Ș, U0219 – ș), respectiv prin „t cu virgulă dedesubt” (U021A – Ț, U021B – ț)
    De reținut: caracterele „ă”, „â”, „î” au fost mult mai „cuminți”, ratând această ambiguitate; ele sunt codate corect în toate standardele și nu au indus niciodată probleme.

2) MICROSOFT a adoptat, în cadrul codării proprietare de pagină CP1250, standardul ISO/IEC 8859-2:1998 (Latin2), adică pe acela care reprezintă incorect literele ș și ț, prin formele cu sedilă („turcești”)!
Această situație s-a perpetuat până la lansarea sistemului de operare Windows Vista, când s-a început procesul de înlocuire a codării ISO/IEC 8859-2:1998 (Latin2) cu cea corectă, ISO/IEC 8859-16:2001 (Latin10).
[ulterior] Precizare primită de la dl. Secară: înlocuirea codării Latin2 cu Latin10 este făcută de Microsoft, începând cu Vista, doar în browser şi clientul de mail, precum şi la unele interfeţe cu alte medii non-native. Sistemul de operare foloseşte (intern) aceeaşi veche codare proprietară CP1250 (Central European), unde diacriticile româneşti NU sunt, în continuare, suportate (implementate)!
Rețineți că sistemul de operare Windows XP, încă larg folosit, este afectat de această anomalie.

3) Pentru a complica și mai mult lucrurile, compania Adobe – primul și cel mai mare producător de fonturi – a considerat că Unicode a greșit când a inventat caracterul Ț/ț cu sedilă, pe motiv că acest caracter nu este folosit nicăieri în lume; drept pentru care a decis ca semnele asociate caracterelor Ț/ț cu sedilă să fie reprezentate grafic cu virgulă! Cu alte cuvinte, în „căsuța internă” rezervată codurilor U0162, U0162 (Ţ, ţ cu sedilă, conform standardelor) au fost „desenate” caracterele Ț, ț cu virgulă (care ar fi corespuns codurilor U021A, U021B, conform standardelor).
De menționat: (a) pe lângă seturile de caractere (fonturi) „de sistem” (Microsoft, uzual), pe un calculator se folosesc o multitudine de alte fonturi; în practică, foarte puține dintre programele ce rulează pe acel calculator (în afară de sistemul de operare) folosesc fonturile de sistem; majoritatea folosesc alte fonturi, dintre cele instalate pe computerul respectiv;
(b) în afișarea unui semn grafic de către calculator, importanță capitală o au atât codurile interne ale acelui caracter (codul UNICODE al acelui semn grafic), cât și „desenul” implementat de producătorul respectivului set de caractere (realizatorul acelui font)

4. Dezinteresul, lipsa de implicare a autorităților române cu competențe în domeniu.
Este adevărat că în anul 1997, cu ocazia revizuirii standardului internațional ISO 8859-2 (Latin 2), Asociația de Standardizare din România (ASRO, organismul cu atribuțiuni explicite în domeniu, IRS la vremea respectivă) a protestat la secretariatul ISO împotriva acestei asocieri, deoarece prin acest standard limbii române îi erau atribuite în mod greșit caracterele Șș/Țț cu sedilă și în același timp lipsesc caracterele Șș/Țț cu virgulă. În buna tradiție românească, însă, demersul nu a fost dus până la capăt, implicațiile nu au fost urmărite pentru o eventuală corectare, după adoptarea – la inițiativă românească! – a standardului ISO/IEC 8859-16:2001 (Latin10), standard ce reglementează, complet, diacriticele limbilor Albaneză, Croată, Engleză, Finlandeză, Franceză, Germană, Irlandeză Galică (noua ortografie), Italiană, Latină, Poloneză, Română, Slovenă și Ungară.
Mai mult, conform www.secarica.ro, un „nume” respectat în domeniu, care se ocupă de foarte multă vreme de această problematică, nici măcar în acest moment:

… nu se dorește renunțarea la caracterele Unicode cu sedilă. Deocamdată se dorește doar completarea suportului pentru caracterele Unicode cu virgulă, în așa fel ca trecerea de la scrierea în limba română incorectă la cea corectă să fie posibilă din punct de vedere tehnic.

Din câte cunosc, suntem cu adevărat „originali” în acest domeniu, nicio altă țară necunoscând/netolerând o asemenea ambiguitate în codarea diacriticelor „naționale”!.

De menționat că un factor suplimentar (de mai mică importanță, însă, în opinia mea) a fost opoziția ciudată (și cu argumente ilare), din partea SUA și Olanda, referitoare la standardul 8859‑16 (lucru ce a întârziat adoptarea sa) sau ignorarea îndelungată de către Microsoft a acestui standard.

Ș/Ţ cu virgulă

Ș/Ț cu virgulă (corecte)

Ș/Ţ cu sedilă

Ş/Ţ cu sedilă

Mai multe pe acest subiect, al codării diacriticelor românești și a implicațiilor complexe ale acestei codări în utilizarea curentă (a scrierii corecte în limba română) puteți consulta pe secarica.ro 

 


 

„Abrambureala” prezentată mai sus are, în practică, efecte profunde atât asupra numelor de domeniu ce conțin diacritice românești (amintite și în articolul anterior), asupra întârzierii (inadmisibile, în opinia mea) a acceptării de către roTLD (ICI București) a diacriticelor în domeniile .ro, cât și asupra afișării corecte a diacriticelor românești pe site-urile web – inclusiv cel de față (problema afişării a fost rezolvată pe www.scrie-româneşte.net cu ajutorul dlui Adam – detalii în curând, într-o viitoare continuarea acestui articol).

 

 

A) IMPLICAȚII ASUPRA NUMELOR DE DOMENIU CU DIACRITICE

a) ICI, autoritatea română ce controlează înregistarea domeniilor .ro nu acceptă (nu permite) folosirea diacriticelor românești în numele de domenii .ro, prevalându-se de ambiguitatea coexistenței celor două standarde (ș și ț „românești” și „turcești”). Suntem, astfel, printre ultimele țări din Europa care nu au adoptat încă diacritice în numele domeniilor naționale!

Este o situație/întârziere inacceptabilă din punctul meu de vedere. ICI nu a fost nici măcar în măsură să furnizeze un răspuns clar la întrebarea mea referitoare la termenul estimat de implementare a diacriticelor românești în „spectrul” .ro! E adevărat, e o situație confuză, particulară, însă o rezolvare se poate cu siguranță găsi!

În măsura timpului, o să revin cu un articol dedicat, în care o să prezint și o hartă a Europei cu țările care au adoptat deja diacritice în domeniile „naționale”. Toate țările din Balcani (cu excepția câtorva republici separate din fosta Yugoslavie) au făcut deja acest pas. Până și Republica Moldova a adoptat deja această măsură!

 

b) Așa cum am scris deja în articolul anterior, domenii cu diacritice românești se pot totuși cumpăra de la alți „registranți” (registrars – în engleză). Pentru campania „Scrie Românește pe Net” am achiziționat domenii din spectrul „.net” (generic).

Însă domeniul „scrie-româneşte.net” (scris cu „ş cu sedilă”) este diferit de același domeniu scris cu „ș cu virgulă” (codările Punny aferente celor două transcrieri sunt diferite! – vezi detalii în articolul anterior)

Consecință directă: orice sait ce dorește să folosească un nume conținând diacritice românești ce includ „ș” sau „ț” ar trebui să achiziționeze atât domeniul cu varianta „românească”, cât și cel cu varianta „turcească” a literei/literelor respective.

În cazul meu a fost simplu , având doar o singură apariție (un singur caz – „ș”-ul). A trebuit să cumpăr doar două domenii (în practică – 3, am cumpărat și varianta complet fără diacritice – „scrie-romaneste.net”, pentru uzabilitate și conveniență) . Dacă însă numele de domeniu ar conține mai multe astfel de apariții (ș sau ț, precum cel al domeniilor ce includ cuvântul „șugubăț” – doar un exemplu) , ar trebui – teoretic– luate în calcul toate variantele de combinare a celor două semne (scrise cu sedilă, respectiv cu virgulă – 4 la număr).

 

B) IMPLICAȚII ASUPRA SCRIERII ȘI – MAI ALES – AFIȘĂRII CORECTE A DIACRITICELOR

Pe laptopul pe care îl folosesc am Windows XP. Cu suport (automat, de sistem) doar pentru codarea ISO 8859-2 – cea cu sedile (ș și ț „turcești”).

Deși știu sigur că este posibil în practică (am văzut exemple), nu am reușit până acum – în ciuda documentării intensive și in ciuda tuturor testelor pe care le-am făcut – să instalez un driver care să-mi permită să scriu corect românește și din acest punct de vedere – cel al formei semnului grafic afișat sub T sau S (cel al codării corecte folosite pentru ș ț; sau, mai pe românește, să scriu cu ș și ț cu virgulă dedesubt, „românești”, și nu cu sedilă – „turcești”!). E posibil să fie o problemă particulară legată de „hardware”-ul laptopului pe care îl folosesc, nu știu. Am abandonat însă, pe moment, încercările.

Cu ajutor substanțial din partea d-lui Cristian Adam – căruia îi mulțumesc și pe această cale, am reușit azi, 21.11, să-mi „instruiesc” / „peticesc” programele de pe laptop (sistemul de operare Windows XP și driverul de tastatură) astfel încât să-mi permită (1) scrierea corectă, folosind ș, ț, Ș, Ț cu virgulă („românești”) și (2) să-mi afișeze corect aceste 4 caractere pe ecran.

Toate articolele semnate „Cornel” sunt, în consecință, scrise cu astfel de „ș”-uri și „ț”-uri – „turcești”, cu sedilă, și nu cu virgulă dedesubt, cum ar fi firesc și „normal” (vezi mai jos).

[actualizare 22.11] Articolele mele sunt în curs de actualizare a diacriticelor „greșite” (cu sedilă) în cele corecte, cu virgulă dedesubt („românești”)

Nu mă preocupă foarte mult problema „corectitudinii absolute” a scrierii mele (din punctul de vedere al sedilei / virgulei de sub ș, ț). Așa cum ați văzut și mai sus, în citatul din secarica.ro, forma cu sedilă nu este „repudiată” oficial, cel puțin nu încă.

[actualizare 22.11] Schimbul de mesaje cu dl. Cristian Adam m-a determinat să reflectez mai mult asupra afirmației de mai sus. Nu sunt încă foarte convins că scrierea cu diacritice cu sedilă este de condamnat (sunt oameni care se străduiesc să scrie cu diacritice dar nu reușesc, datorită vârstei și/sau lipsei de suficiente abilități „computeristice”, să-și seteze corect calculatorul pentru a folosi diacriticele cu virgulă). Înclin însă să adopt o poziție mai „de forță”, care să militeze pentru impunerea hotărâtă a scrierii cu diacritice corecte („românești”, și nu „turcești”). Voi reveni cu un articol dedicat exclusiv acestui subiect (va conține și un tutorial explicit pentru instalarea / „activarea” diacriticelor cu virgulă)

Mă preocupă însă – și deloc în mică măsură – modul în care sunt afișate aceste articole, pe alte calculatoare decât cel al meu – pe calculatoarele voastre, stimați cititori. Cel puțin teoretic – și, presimt, valabil în practica destulelor cazuri – „ș”-urile din „ț”-urile din articolele mele se vor afișa ciudat, aiurea pe unele calculatoare – cele care au doar seturi de caractere (fonturi) care conțin doar formele cu virgule! Sau viceversa.

Foarte probabil există o soluție (și) pentru această problemă. Eu unul – dat fiind și caracterul de hobby al activității mele pe internet – nu am reușit s-o găsesc (sau s-o implementez; știu una, teoretică – înglobarea unor fonturi în „programul” folosit la implementarea saitului – dar nu am găsit timpul și motivația necesare documentării pentru implementarea practică) încă.

[actualizare 22.11]Mulțumită aceluiași dialog electronic cu dl. Cristian Adam, știu acum soluția problemei de mai sus. Soluția implementată de dl. Adam, folosită și de wikipedia Ro, presupune schimbări doar în paginile de pe server, mai precis adăugarea unui „progrămel” javascript pe fiecare din paginile saitului; acest script va „convinge” browserul dumneavoastră să afișeze satisfăcător diacriticele (afișând ș, ț cu sedilă, acolo unde variantele corecte, cu virgulă, nu sunt „de găsit” pe calculatorul cititorului). Mai multe despre soluția tehnică în cauză în viitorul articol „Ş românesc versus Ş turcesc reloaded (episodul 2)”.

 

 

Share

ALTE ARTICOLE
Postat în DOCUMENTAȚIE

2 comments on “„Ș românesc” versus „Ş turcesc”
  1. Madalin spune:

    Aparent mai sunt și alte aberații:

    Abăluṭ!=ță
    Bucureṣ!=ști

    Ș si Ț cu . in loc de , sub…

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

*