Elementi chiave

Scalabilità

Datafari è in grado di indicizzare centinaia di milioni di documenti, utilizzando un Hadoop come grande architettura dei dati, su più macchine.

Affidabilità

In modalità distribuita, la tecnologia Zookeeper e Solrcloud permettono una gestione automatica di errori di sistema.

Flessibilità

Vicino gestione in tempo reale, i tipi di dati a più campi di ricerca (int, stringa, data ...), la modalità di schema-less, possibilità di aggiungere campi dinamici.

Sicurezza

I dati trasmessi dai connettori che strisciano al motore di ricerca vengono inviati tramite https con la crittografia, quando il crawler e il motore sono separati.


Apache Solr

Solr è uno strato web, sulla base di Lucene. Aggiunge functionnalites quali: web server, il clustering, le pagine web per l'amministrazione. Non è un sistema di ricerca completo in grado di connettersi ai dati e visualizzare i risultati. Si tratta di una spina dorsale affidabile, in grado di scalare attraverso le macchine di clustering, facilmente gestibile e chiede il sostegno REST. È possibile ottenere ulteriori informazioni sul sito web tecnico di Solr. Come Lucene, Solr è parte del progetto Apache Lucene. Come tale, è disponibile sotto licenza Apache v2. Solr è il riferimento al motore di ricerca open source. Propone fucntionalities avanzati, può essere facilmente configurato, ed è quindi un concorrente feroce nei confronti delle tecnologie di ricerca di proprietà.