[ Back ]
 
Fiabilitatea informatiilor din Internet
si credibilitatea paginilor Web
de Mihai Jalobeanu
Cercetator, Chairman RILW
I. Putem vorbi despre fiabilitatea informatiilor?
Fiabilitatea unui sistem este definita ca o capacitate a sistemului de a functiona conform cartii tehnice si fara defectiuni, un anumit interval de timp. Durata preconizata, de la momentul punerii în functiune si pâna la prima defectiune se numeste durata de viata a sistemului. Fiabilitatea este estimata numeric prin probabilitatea ca sistemul sa functioneze fara defectiuni pâna la momentul t > 0, probabilitate calculata de proiectant sau executant pe baza caracteristicilor componentelor sistemului si a rezultatelor controlului de calitate. Pentru a stabili fiabilitatea unui aparat si durata sa de viata se analizeaza minutios defectiunile ce pot surveni, erorile de functionare si se introduc metode profilactice pentru a le preîntâmpina. 

Durata de viata a sistemului, în majoritatea cazurilor, este determinata de componentele cele mai putin fiabile ce intra în componenta sistemului, sau de defectarea componentei celei mai solicitate. Proiectantul corecteza o astfel de situatie prin rezervare, adica prin adaugarea de elemente suplimentare fara de cele minim necesare pentru realizarea functiunilor. Sistemul va îngloba elemente de rezerva (redundante) care functioneaza în paralel, sau care intra în functiune doar atunci când elementul de baza "oboseste". Similar cu livrarea autoturismelor cu o roata de rezerva.

Analiza fiabilitatii calculatoarelor a condus la extinderea acestui studiu si asupra produselor program, la definirea si analiza fiabilitatii soft-ului ("Software Reliability Engineering and Testing": John D. Musa http://members.aol.com/JohnDMusa, precum si Ramon V. Leon - http://web.utk.rdu/~leon ) .

Analiza, depistarea si corectarea erorilor din pachetele de programe, a bug-urilor, este o activitate curenta în orice fiirma de soft. In decursul anilor s-au încercat diferite procedee de automatizare a depistarii si corectarii erorilor, realizarea unor mecanisme de testare a programelor. A ramas celebru un panseu al lui Djikstra care suna cam asa: "Orice program de test poate evidentia cel mult prezenta unei erori, niciodata absenta erorii". 

Trecerea de la un sistem de operare la altul, de la un limbaj de programare la altul, odata cu amplificarea continua a configuratiilor hard si cu sporirea vitezei de calcul, în conditiile extinderii utilizarii calculatoarelor, au condus la solutii de transcriere automata si la studii privind ingineria reutilizarea programelor, revitalizând programe care "murisera" odata cu scoaterea din fabricatie a calculatoarelor pentru care fusesera realizate. Apar de fapt noi versiuni ale aplicatiilor, adaptate noilor sisteme de operare si noilor configuratii hard, versiuni stabile care rezista uneori câtiva ani, alteori, mai putin stabile, sunt înlocuite de versiuni noi, mai complete si mai adecvate noilor conditii si noilor utilizatori.

In firmele de soft exista norme privind munca de programare, si conditii de calitate, care stabilesc media erorilor la mia de linii de cod, numarul mediu de erori care pot fi corectate în etapele de testare, precum si procentul de eventuale erori nedepistate. Gradul de acceptare al acestor erori depinde de destinatia sistemului si influenteaza desigur pretul de vânzare al produsului program, sau al sistemului în ansamblu. Cerintele fiind altele la un calculator de proces, realizat pentru o centrala nucleara sau pentru un program spatial, fata de un calculator personal - domestic. Vorbim despre siguranta în functionare a programului si a întregului sistem si acceptam ca un program are o durata de viata limitata de aparitia unor erori (de exemplu de depistarea unor "gauri de securitate"), sau de aparitia unei versiuni noi, mai performante, care îl înlocuieste.

Care ar fi însa elementele de fiabilitate pentru informatiile din Internet? Care ar fi defectiunile sau erorile ce pot interveni în manevrarea acestor informatii si câte din acestea au legatura directa cu continutul? Putem delimita defectiunile care privesc direct fisierele ce includ anumite informatii, de cele care afecteaza serverele în gestiunea carora se afla acele fisiere? Putem determina un timp de viata specific informatiei, sau durata ei de viata este data doar de a serverului care o "publica"?

Si în cazul fisierelor accesibile prin FTP, si pe arhivele grupurilor de discutii, informatiile sunt pastrate adesea si dupa ce îsi pierd actualitatea sau importanta. De multe ori se întâmpla la fel si în cazul paginilor Web. Cu exceptia unor incidente sau catastrofe, sau a unor situatii banale de tip renuntarea la abonament, sau criza de spatiu disc. Ne putem imagina si situatii în care administratorul pedant al serverului (Web sau FTP) analizeaza constiincios fisierele catalog si, constatând ca a disparut interesul publicului pentru acele documente, îsi asuma responsabilitatea stergerii lor de pe server. 

Situatia mai naturala, dar prea rar întâlnita, este aceea în care autorul documentului revine asupra continutului, editând fisierul, modificându-l, actualizându-l, verificând si aducând la zi legaturile, schimbând forma de prezentare, sau raspunzând eventualelor observatii critice si schimbând, eventual, si numele - titlul documentului. Dar autorul, împreuna cu cititorii sai, va constata ca vechea versiune, disparuta de mult de pe discul serverului, persista în memoria motoarelor de cautare, aparând, între rezultatele cautarilor tematice, împreuna cu versiunea noua. Ba mai mult, urmare a unui proiect demarat în 1996, o arhiva impresionanta din California, salveaza si mentine pentru posteritate documente semnificative din întregul spatiu public (Internet Archive Wayback Machine http://web.archive.org , proiect demarat de Alexa Inc. - http://www.alexa.com ).

Asa cum un program functioneaza de câte ori este apelat sau lansat în executie si socotim timpul sau de viata prin numarul de rulari, la fel, viata unui document, a unui fisier text din Internet, o putem masura - contoriza prin numarul de accesari sau parcurgeri. Chiar daca, intuitiv, am fi înclinati sa privim perioada în care fisierul se gaseste plasat la dispozitia publicului, pe serverul Web, ca timp de viata, considerând numarul de accesari si de referiri (legaturi spre documentul în cauza, din alte pagini Web) drept o masura a interesului pentru continutul acestuia. Insa plasarea unui fisier în spatiul public, printre alte documente de pe un server Web, nu înseamna înca 'punerea sa în functiune'. El nu va ajunge cunoscut decât atunci când într-una din paginile index, sau pe un traseu deja circulat, vom înscrie indicatoare, legaturi spre acel document, recomandându-l printr-o succinta prezentare. Sau atunci când va ajunge sa fie indexat de motoarele de cautare. Pentru a grabi ai sprijini acest proces de indexare exista numeroase retete, privind, pe de o parte introducerea unor înregistrari speciale (meta-declaratii cu termeni cheie), iar pe de alta, înscrierea documentului sau a centrului Web la cât mai multe din sutele de mii de masini de cautare.

II. Credibilitatea documentelor Web
Acum 10 ani, când a aparut în spatiul public, virtual, în Internet, prima pagina Web (a laboratorului de fizica particolelor elementare de la Stanford - SLAC - de fapt o pagina de test intitulata "Slac Home Page for World", încarcata la 6 Martie 1992 - http://www.slac.stanford.edu/archive/1992) era imposibil de estimat amploarea pe care a luat-o World Wide Web-ul, publicarea HTML si navigarea în spatiul virtual. 

Usurinta realizarii paginilor Web si costurile incomparabil mai mici ale publicitatii Web în comparatie cu mediile publicitare traditionale (Televiziune, radio, sau publicatii tiparite) au facut ca, în doar câtiva ani, World Wide Web-ul, introdus ca modalitate de cooperare stiintifica, sa devina un spatiu pentru reclame de tot felul, un mediu de instruire sau de cautare a altei personalitati. Inca în ianuarie 1996, Matthew Ciolek sesiza invazia mediocritatii, vorbind despre trecerea de la WWW la MMM (Multi-Media Mediocrity) - "Today's WWW - Tomorrow's MMM? The Specter of Multi-Media Mediocrity", Computer 29 ( January 1996, pp106-108 ) - http://computer.org/computer/co1996/r1toc.htm.

Analiza documentelor Web s-a facut la început pe baza criteriilor de recenzare si catalogare puse la punct pentru publicatiile tiparite. Domeniul fiind asociat biblioteconomiei si privind si tranzitia bibliotecilor traditionale spre biblioteci virtuale. In paralel, mai ales din ratiuni comerciale, s-au elaborat criterii de clasificare a centrelor Web, în vederea stabilirii unei ierarhii (topul centrelor Web), cel mai adesea pe baza numarului de voturi exprimate de vizitatori, luând în calcul mai mult forma - modul de prezentare, modernitatea si impactul vizual, decât continutul tematic O serie de publicatii din lume publica periodic aceste rezultate, mai mult sau mai putin detaliate. 

La noi, Weekly News, publicaie electronica saptamânala realizata de o echipa de la Iasi (www.epress.ro) coordonata de Adrian Moisei, include în fiecare numar, în capitolul intitulat netsurfing, o analiza a unor centre Web din domeniul .ro, acordând note de la 1 la 100 pentru viteza, continut si aspect. 

Reproduc mai jos integral un articol aparut în cursul anului 2000, de fapt o compilare a lucrarii celebre a lui Jakob Nielsen "Top Ten Mistakes in Web Design", 1996, http://www.useit.com. Pentru ca este, dupa stiinta mea, singurul material de la noi pe aceasta tema.

III. Topul 10 al greselilor din Web Design - bogdan.morar@epress.ro
1. Folosirea frame-urilor
Impartind o pagina în frame-uri aceasta devine foarte confuza pentru utilizatori, deoarece frame-urile încalca stiulul de model fundamental al utilizatorului despre o pagina web. Toate ca toate, dar nu avem posibilitatea saafacem un "bookmark" la pagina curenta si sa ne întoarcem la ea mai târziu (bookmark-ul are un link catre alta pagina cu frame-uri), adresele web nu mai functioneaza si tiparirea este greoaie. 

2. Gratuitatea folosirii ultimei tehnologii
Nu încercati sa atrageti utilizatori în site-ul vostru folosind laude despre ultimele tehnologii folosite. Veti atrage câtiva, dar majoritatea utilizatorilor vor judeca în functie de continutul ajutator si de diversitatea ofertei de produse si servicii bune. Folosind cuvinte ca "ultima" sau "cel mai" înainte de versiunea finala, este sigur o cale de a descuraja utilizatorii: daca sistemul lor "crapa" în timp ce viziteaza site-ul vostru, puteti paria ca ei nu se vor mai întoarce niciodata în site.

Doar daca sunteti într-o afacere de vânzari de produse Internet sau servicii, cea mai buna cale este a astepta pâna câstigati experienta cu respectul fata de caile apropiate în folosirea noilor tehnologii. Când tehnoredactarea era "tânara", se întroduceau douazeci de fonturi în document, deci gasim similaritate în designul pentru Web.

Iata un exemplu: folositi VRML daca aveti informatii care sunt legate de spatiul tridimensional (adica, design arhitectural, jocuri "ucide tot", planuri chirurgicale). Nu folositi VRML dacs datele sunt N-dimensionale, decât dacs sunt necesare pentru producerea unor viziuni bidimensionale care se alineazs cu tipul de vizualizare di tipul de hardware pe care il are utilizatorul.

3. Text "Scalabil", sublinieri di animatii rulând constant
Niciodata sa nu includeti elemente ale paginii care se misca încontinuu. Imaginile miscatoare au puterea unor viziuni umane periferice. O pagina ar trebui sa nu emuleze o piata într-un oras, pentru ca este un atac constant la simturile umane: dati-i userului ceva pace si liniste sa citeasca textul! De asemenea, <BLINK> este un mic dracusor.

4. Adrese de web (URLs) complexe
Atâta timp cât adresabilitatea la nivel de masina, adica o adresa de web (URL) nu ar trebui expusa în interfata utilizatorului, se observa ca utilizatorii actuali încearca sa decodeze adresele paginilor pentru a interactiona cu structura web-site-urilor.

Utilizatorii fac aceasta pentru ca simt lipsa suportului de navigare si pentru a gasi sensul localizarii în web browser. Astfel, un URL ar trebui ss contina directoare citibile si nume de fisiere care reflecta natura informatiei De asemenea, uneori, utilizatorii au nevoie sa tasteze un URL, deci încercati sa reduceti riscul de tastare folosind nume scurte cu toate caracterele mari si fara caractere speciale (multa lume nu stie sa tasteze caracterul ~).

5. Pagini "orfane"
Fiti sigur ca toate paginile includ o specificatie clara a site-urilor de care apartin pentru ca utilizatorii sa poata accesa direct fara sa mai intre în pagina voastra. De asemenea, fiecare astfel de pagina ar trebui sa faca legatura la pagina voastra.

6. Pagini lungi
Doar 10% din utilizatori fac "scroll" informatiei ce este vizibila pe ecran când receptioneaza o pagina. Toate continuturile critice si optiunile de navigare ar trebui sa apartina zonei de sus a paginii (header-ului). Utilizatorii folosesc mai mult scroll-ul cu cat câstiga mai multa experienta. Recomandarea este sa reduceti pe cât se poate scroll-ul în paginile de navigare.

7. Lipsa de suport de navigare
Nu va gânditi ca utilizatorii stiu atat de multe despre site-ul vostru cat stiti voi. Intotdeauna vor avea dificultati în gasirea de informatii, deci au nevoie de un suport, în sensul unei perceperi a structurii. Porniti designul vostru cu o întelegere buna a structurii spatiului destinat informatiei si comunicati explicit aceasta structura utilizatorului. Furnizati o harta a site-ului (site map) si lasati utilizatorul sa înteleaga unde se afla si încotro sa o apuce. De asemenea, aveti nevoie de o facilitate de cautare atata timp cat suportul de navigare nu e satisfacator.

8. Culori ale link-urilor
Link-urile catre paginile pe care utilizatorii pot sa le viziteze sunt albastre; linkurile catre paginile deja vizitate sunt mov sau rosii. Nu va jucati cu astfel de culori atata timp cât abilitatea de întelegere a linkurilor ce au fost vizitate este unul din ajutoarele de navigare, care sunt standard în majoritatea browser-elor. Consecventa este cheia de a învata tilizatorii ce înseamna culoare unui link.

9. Informatii "expirate"
Trebuie sa va gânditi la bugetul alocat angajarii unui "gradinar" web, ca parte din echipa voastra. Aveti nevoie de cineva care sa rupa buruienile si sa replanteze florile ca schimbari ale website-ului, dar si mai mult personal pentru a crea continut nou, pentru întretinere. In practica, întretinerea este un mod ieftin de a spori continutul website-ului atata timp cat multe din paginile vechi îsi mentin propria relevanta si ar trebui legate de noile pagini. Binenteles, câteva pagini ar trebui eliminate complet de pe server dupa expirarea datei de utilizare.

10. Durata descarcarii
Aceasta greseala este inclusa în acest top din cauza ca multa lume nu întelege ce înseamna, nu din cauza ca este importanta. Traditional ghidurile factorilor umani indica 10 secunde ca fiind maximul timpului de raspuns, înainte ca utilizatorii sa îsi piarda interesul. Tehnologic vorbind, aceasta limita de timp poate fi redusa la 7 secunde, aceasta ultima limita fiind si un instrument de marketing, cu care puteti atrage clienti. Pe web, utilizatorii se antreneaza sa îndure atâta suferinta cât sa accepte sa se mareasca aceasta limita la 15 secunde pentru câteva pagini.

Chiar si website-urile cu numar ridicat de utilizatori trebuie sa ia în considerare acest timp de descarcare (download): se observa ca se acceseaza site-uri de pe calculatoarele de acasa, dupa-masa sau seara, deoarece utilizatorii sunt prea ocupati sa navigheze în timpul orelor de lucru. Folosind latimea de banda, navigarea se înrautaseate, nu mult, din cauza ca Internetul adauga utilizatori mai multi decât infrastructura poate duce.
Nota: Mi-am permis sa operez doar câteva corectii minimale, introducând câteva virgule, fara a interveni cu adevarat în text.

In decursul anilor, diferiti autori importanti din spatiul virtual au formulat cerinte si reguli pentru realizarea unei pagini Web de succes. Asociatia publicistilor Web, HTML Writers Guild, organizeaza cursuri si difuzeaza o publicatie lunara cu sfaturi si noutati. Gerry McGovern, în publicatia sa electronica numita New Thinking, este unul dintre autorii ce militeaza constant pentru rolul preponderent pe care trebuie sa-l aiba continutul tematic în paginile Web. Si în multitudinea de ghiduri privind proiectarea si realizarea paginilor Web pot fi gasite criteriile de baza în aprecierea sau succesul unui document HTML.

La Universitatea Stanford, în cadrul laboratorului pentru tehnologii persuasive (Stanford Persuasive Technology Lab), functioneaza de mai multi ani un colectiv - proiect de studiere a credibilitatii în spatiul Web (Stanford Web Credibility Research http://webcredibility.org ). Dintre cercetatorii cu contributii importante în clarificarea acestei chestiuni, în formularea unor criterii si în realizarea unor studii si sondaje, trebuie amintiti:

  • B.J. Fogg si colaboratorii sai de la Stanford - "Web Credibility Research: A Method for Online Experiments and Early Study Results" - http://webcredibility.org 
  • Alastair Smith - Victoria Univ. of Wellington, Noua Zeelanda http://www.vuw.ac.nz/~agsmith/evaln/evaln.htm; "Testing the Surf: Criteria for Evaluating Internet Information Resources", in The Public-Access Computer Systems Review8, no.3, 1997 - http://info.lib.uh.edu/pr/v8/n3/smit8n3.html
  • J. Nielsen - http://www.useit.com/alertbox/990307.html 

  • IV. Criterii de evaluare a credibilitatii paginii Web - dupa Alastair Smith
     

  • Scopul
    • Apare scopul formulat explicit, sau este doar o digresiune? 
    • Focalizarea - ce aspecte sunt tratate? Include si teme conexe? 
    • Adâncimea - care este nivelul la care este formulat si care e nivelul presupus al audientei? 
    • Actualitatea - este informatia la zi? Este ea limitata la o anume perioada? 
    • Formatul - este adecvat scopului declarat? Il serveste, sau nu?
  • Continutul 
    • Originalitatea - contine informatii originale sau doar legaturi si referinte bibliografice? Este o pagina independenta sau doar o reformulare sau traducere a altui document? Sau este rezumatul HTML a unui document disponibil în alt format (tiparit, carte electronica, CD-Rom)? 
    • Corectitudinea - include cumva informatii eronate sau contradictorii? Se pot observa tendinte ideologice sau propagandistice? Care este motivatia autorului? Nu cumva reclama? 
    • Seriozitatea - este precizata responsabilitatea? Un expert sau o organizatie? Este autorul un specialist al domeniului? Sunt mentionate sursele de informare? Sunt verificabile informatiile? Poate fi contactat autorul pentru lamuriri sau observatii? 
    • Evolutia - este o pagina statica sau evolueaza în timp? Cât de des se modifica? Apar precizate date asupra modificarilor recente? Apare specificata responsabilitatea actualizarii? Corespund datele schimbarii cu evolutia ideilor? 
    • Legaturile spre alte resurse - sunt la obiect? Sunt la zi si active? Apar precizarile necesare asupra autorilor? Suntem avertizati când legtura ne conduce la un alt server? 
    • Calitatea formularii - este textul bine scris? Contine greseli gramaticale? Este suficient de clar? Este bine structurat? 
    • Audienta - se potriveste continutul si scopul, audientei declarate? Care este nivelul de cunostinte cerut audientei? Sunt informatiile satisfacatoare pentru audienta? Concorda cu nivelul de acces la Internet al acesteia? 
    • Referintele - exista referinte sau recenzii citate? Au acestea de a face cu continutul paginii sau doar cu expertiza autorului? Sunt referinte serioase si verificabile, sau doar conjuncturale? 
  • Forma si accesibilitatea
    • Relatia cu cititorul - este pagina utilizabila? Poate fi parcursa în bune conditiuni? Este suficient de structurata? Sprijina interactivitatea cititorului? Punerea în pagina si legaturile interne sunt suficient de simple? S-a tinut seama de nivelul de pregatire al audientei?
    • Pretentiile hard/soft - Exista cerinte speciale sau particulare? Pretinde documentul anumite configuratii speciale hard/soft? Poate sau nu sa fie accesat cu orice navigator? Au imaginile inclusa descrierea textual?
    • Grafica si Multi-media - sunt adecvate scopului? Fac elementele grafice mai placuta parcurgerea? Mai intuitiva întelegerea? Sau distrag pur si simplu atentia?
    • Organizarea - include documentul un rezumat sau/si un cuprins? Include instructiuni de cautare tematica? Ajuta cititorul sa parcurga informatiile? Sunt unitare caile de navigare în toate componentele paginii Web? Formularele care asigura interactivitatea sunt suficient de bine explicate? Adauga ele ceva în plus la valoarea paginii Web?
    • Conectivitatea - poate fi pagina accesata comod? Fara o asteptare exagerata si fara a receptiona mesaje de eroare? Pentru cititorii cu acces dificil (lent) este asigurata o forma mai simpla, mai rapida? Pentru cei cu deficiente de vedere sau auz, este asigurata o versiune corespunzatoare? 
  • Costul 
    • Este pagina publica si accesibila fara taxe? 
    • Ce costuri impune accesul? Este perceput un abonament sau o taxa de vizitare? 
    • Care sunt restrictiile de copyright? 
    • In cazul perceperii unor taxe, este asigurata confidentialitatea si protectia tranzactiei? 
    • Este asigurata o versiune de test - demonstrativa?
B.J. Fogg si colaboratorii din cadrul laboratorului de tehnologii persuasive de la Stanford, într-un studiu on-line pe 1400 de subiecti ( "What makes Web Site Credible? A Report on a Large Quantitative Study", CHI 2001- Proceedings of ACM CHI 2001 Conference on Human Factors in Computing Systems, 2001. ACM Press - format PDF la http://webcredibility.org ), întreprins în 2001, discutând 51 de elemente diferite din paginile Web, în cautarea factorilor ce afecteaza perceptia credibilitatii, pune în evidenta 5 atribute care maresc credibilitatea: 
    • Senzatia lumii reale, 
    • Usurinta în parcurgere, 
    • Profesionalismul autorului, 
    • Încrederea pe care o degaja, 
    • Grija fata de vizitator.
Precum si doua atribute care o diminueaza:
    • Implicarea comerciala
    • Amatorismul.
Nota: Consideratiile de mai sus au fost provocate de câteva incidente locale care au aratat nu numai cât de putin sunt cunoscute cercetarile mentionate aici, ci cât de putin ne preocupa credibilitatea paginilor în Web-ul românesc. 

[ Back ]