El teu blog de Linux en català

O n’hi haurà a curt o –a molt estirar– mitjà termini. Proliferen arreu d’internet diferents projectes, semblants en el fonamental, diferents en els matisos, per construir un cercador lliure, amb un marcat accent en la innovació per plantar cara al tot-poderós Google. Les diferencies més importants rauen en si l’índex aquest nou cercador ha de ser distribuït (basat en el concepte de computació distribuïda) o bé centralitzat (basat en l’estructura clàssica client-servidor). Hem triat dos projectes per comentar-los amb més profunditat: Ripple i Search Wikia.

Ripple és un projecte que pretén desenvolupar un cercador lliure amb un funcionament semblant als programes d’igual a igual (com l’eMule). La idea és establir com a base una xarxa de diferents nodes amb capacitat per a comunicar-se entre sí que podrien estar constituïts perfectament per ordinadors domèstics (amb suport, si s’escau, d’altres màquines més potents per assegurar-ne l’estabilitat). És un concepte en certs punts semblant al de projectes de computació distribuïda com ara Climateprediction.net o SETI@Home. Al fòrum de desenvolupament s’ha proposat fins i tot oferir funcionalitats extra com a esquer per aconseguir que prou ordinadors domèstics instal·lin el programari que els converteix en un node d’una aranya web distribuïda. Ripple va sorgir en torn a la comunitat Kriptópolis fa poc més d’un mes, per la qual cosa encara no està gaire madur. En qualsevol cas, hi ha prou catalanoparlants entre els desenvolupadors com per poder llegir una pàgina principal de Ripple en català i no sembla per tant que hi hagi d’haver problemes de localització a la nostra llengua.

No és pas l’únic projecte per crear un cercador lliure distribuït. Yacy, per posar un exemple, està força més madur: ja permet indexar pàgines a través d’una aplicació descarregable per a múltiples sistemes operatius. Les diferències entre Yacy i Ripple són diverses però no són de gaire importància des del punt de vista conceptual: l’estructura modular, els llenguatges de programació triats per al desenvolupament, etc. D’altra banda, la P2P Foundation impulsa un tercer projecte semblant: Minerva Distributed Search i encara n’existeix un quart anomenat OpenSearch. El fet que les diferències entre projectes no siguin substancials afavoreix la possibilitat de compartir solucions entre ells.

Search Wikia és un projecte de cercador fomentat per l’empresa de Jimmy Wales, un dels dos fundadors de la Wikipedia. Precisament per aquest fet, el projecte ha tingut força ressò a diferents mitjans de comunicació. Volen un cercador transparent, els algorismes del qual siguin públics, que tingui en consideració l’opinió de l’usuari a l’hora de classificar els resultats, que respecti la privadesa i que mostri primer els continguts de més qualitat. Amb l’ajuda de diversos col·laboradors, a Wikia han cercat, classificat i discutit quin programari fer servir d’entre tots els projectes lliures que hi ha en l’àmbit de la indexació de dades. Han dividit la recerca en quatre “laboratoris”, que donen idea de l’ús particular de la tecnologia que empraran per al cercador: el laboratori social, en torn a la reputació social de les URLs i com classificar-les (quelcom similar al que fa Google amb el seu PageRank); el laboratori de semàntica, en torn al processament del llenguatge natural i el seu ús al cercador, el laboratori dels estàndards, en torn a la interoperabilitat del cercador amb altres programes i dels seus components entre ells, i el laboratori del distribuït, en torn a com la computació distribuïda pot ajudar a Wikia Search. No obstant aquest últim laboratori, dona la sensació que la importància que prendrà el concepte de computació distribuïda a Wikia Search és menor que el que tindrà a Ripple, ja que Wikia ha comprat tota una bateria de servidors per posar-lo en marxa. Ahir va entrar en funcionament la beta privada i el dia 7 de gener hi haurà una primera versió pública.

Wikia podrà emmirallar-se en altres projectes que s’han desenvolupat en el camp dels cercadors i el programari lliure, com Nutch i Lucene per citar-ne dos exemples, i compartir-hi recursos.

Ambdós models comentats poden servir per aconseguir un cercador lliure realment eficaç: un cop la infraestructura ja està triada, quant de temps haurem d’esperar per veure’n els resultats?