English

RoBloggersSurvey2008

marker  Blog/Categorii
marker  Arhiva
marker  Calendar
  • October 2021
    Mon Tue Wed Thu Fri Sat Sun
    <<  <   >  >>
            1 2 3
    4 5 6 7 8 9 10
    11 12 13 14 15 16 17
    18 19 20 21 22 23 24
    25 26 27 28 29 30 31
marker  Cautare
marker  Ultimele comentarii

Rezultate RoBloggersSurvey2007

TPark - sistem de parcare prin mobil

eLiberatica - The Benefits of Open and Free Technologies Conference 2008

Proiectul  Zestre pentru Europa  Capsula Timpului

eLearningBlog este blogul lunii august la jurnalismonline.ro

Castigator la categoria Cel mai informativ blog
marker Pe bloguri despre bloguri

Juriu roblogfest 2008

JobShop Timisoara

eLearningBlog

O modalitate de a urmari dinamica blogosferei romanesti cu Google Blog Search
02/09/08

In insemnarea Interesting Results from Google Blog Search din Google Operating System, Ionut spune ca la cautarea Google Blog Search cu:

label:orice_termen // orice_termen nu are nici o semnificatie
view:orice_termen

"Google ignores your query and displays a list of blog posts. We can assume it's a list of blog posts relevant for any query."  

Eu inteleg ca rezultatele afisate cronologic se refera la RSS-urile pe care Google Blog Search le-a indexat in intervalul de timp precizat, de 1 ora, 12 ore, o zi, o saptamana, o luna sau oricand.

Ce informatii interesante putem obtine dand de exemplu in campul de cautare:

label:anything

si selectand ca interval de timp o ora?

Google Blog Search gaseste peste 20000 rezultate, care ar reprezenta blogurile / site-urile cu RSS ce s-au actualizat si au trimis ping sau au fost indexate.

Este o masura a activitatii blogurilor / site-urilor cu RSS. Se poate observa si limba in care acestea sunt scrise, engleza primeaza.

Analizand fisierul XML cu site-urile de la care serverul de ping Google ( ce exista din octombrie 2006 ) primeste semnal intr-un minut - http://blogsearch.google.com/changes.xml?last=60 - se gasesc 3500 rezultate. Aceasta inseamna 3500 * 60 * 24 = 5 milioane / zi.

Cautarea Google Blog Search pentru label:orice_termen afiseaza aproximativ rezultatele ce se regasesc in format XML in blogsearch.google.com/changes.xml. Rezultatele se pot monitoriza si prin RSS-ul oferit de Google Blog Search.

Unde mai putem gasi informatia referitoare la RSS-urile ce se actualizeaza?

Ne amintim ca primul server de ping a fost cel al lui weblogs.com, initial informatiile acestuia erau utilizate de motoarele specifice RSS-urilor.

La weblogs.com se afiseaza in timp-real RSS-urile ce se actualizeaza - Recently Updated Weblogs. Ar trebui ca in mare parte sa fie RSS-uri pe care le gasim si la cautarea la Google Blog Search, cu label:anything.

La Download the latest Weblog change lists /  Get the last five minutes of changes apar cam 15000 de RSS-uri. Presupunand ca este o cifra medie, ajungem la 15000 * 12 * 24 = 4,32 milioane / zi.

Technorati monitorizeaza in medie 1,5 milioane de insemnari pe zi, conform ultimului raport.

Sa recapitulam:

Ordinul de marime este acelasi; diferenta se datoreaza faptului ca am plecat de la intervale mici de timp pentru Google Blog Search si  weblogs.com - 1 minut, respectiv 5 minute, presupunand ca sunt valori medii si prin inmultiri am ajuns la numarul pe zi.

Revenind la Google Blog Search, daca alegem ca afisarea cautarii sa se faca pentru limba romana - parametrul lr=lang_ro, vom putea monitoriza site-urile cu RSS / blogurile romanesti care se actualizeaza ( fac o paranteza si spun ca cele scrise in alte limbi de romani nu se pot gasi cu acest mecanism ).

Pentru GoogleBlogSearch, label:ceva, rezultate in limba romana, o ora, obtinem:

label:ceva

Cautarea ofera si RSS, deci putem monitoriza acest rezultat intr-un agregator / RSS reader sau il putem incorpora intr-o pagina web cu Grazr, de exemplu, ca mai jos ( ora afisata este GMT ):

Ce informatii putem obtine cu GoogleBlogSearch, label:ceva, rezultate in limba romana, o ora:

  • un ordin de marime pentru numarul site-uri cu RSS / bloguri romanesti care se actualizeaza intr-un interval - de ordinul miilor / zi, a zecilor de mii / saptamana ( pot exista bineinteles mai multe actualizari pe zi ale unui site / blog ) - a se vedea ultima estimare a dimensiunii blogosferei romanesti
  • se pot descoperi bloguri / site-uri noi
  • se pot urmari in timp-real site-urile cu RSS / blogurile scrise in limba romana - bineinteles indexarea realizata de Google Blog Search nu este exhaustiva, perfecta; apar cele ce dau ping la serverul Google, celelalte vor fi indexate dupa ceva timp.

Rezultatele ar trebui sa fie asemanatoare cu cele obtinute cu o prelucrare laborioasa, pornind de la fisierul XML http://blogsearch.google.com/changes.xml si cautand site-uri din domeniul .ro sau mergand pe URL-urile site-urilor ce au dat ping si selectandu-le pe cele in limba romana.

Daca s-au strecurat erori in evaluarile de mai sus, va rog sa-mi spuneti.

Gasiti utila urmarirea actualizarii blogurilor / site-urilor romanesti cu RSS prin cautarea cu GoogleBlogSearch, label:orice, respectiv prin RSS-ul corespunzator?

Posted by Carmen at 09:53:05 pm into the following categories: Blogosfera romaneasca



Carmen Holotescu
Director Timsoft
Activitati curente
Despre acest blog

marker  Sindicare
marker  Microblog

cirip.ro - microblogging

marker  BlogRoll
  • Colectia de bloguri/RSS romanesti
  • Bloguri educationale romanesti
  • Bloguri business romanesti
  • My favourite eLearning blogs
  • Toate RSS urmarite
  • All RSS I read
  • marker  Blogs Tools
    marker  Powered by