Entre los días 17 y 20 de octubre de 2011 se celebró la Apache Lucene Eurocon Barcelona 2011. La Lucene Eurocon es un evento de primer nivel enfocada a la comunidad de usuarios de los proyectos Lucene y Solr que se va repitiendo año tras año en distintas ciudades europeas. La edición del 2010 se celebró en la ciudad de Praga. Aprovechando que este año tocaba en Barcelona el equipo de Research&Development de Emagister al completo (Gerard, Iker y yo) nos inscribimos con el objetivo de poder conocer en primera persona los últimos avances en los proyectos Lucene / Solr.

El coste de la conferencia quedó compensado por el nivel de las charlas que se impartieron. Entre los ponentes había committers de Lucene y Solr tan reconocidos como: Grant Ingersoll, Mark Miller, Otis Gospodnetic, Robert Muir, Yonik Seeley (creador de Solr) y Uwe Schindler.

En mi opinión, el primer día fue el más completo. La keynote inaugural Search + Big Data: It’s (still) All About the User, a cargo de Grant Ingersoll, fue el disparo de salida a un conjunto de charlas de lo más variado. A destacar, el ejemplo de clustering de Stackoverflow que hizo Frank Scholten en “Configuring Mahout Clustering Jobs” así como los ejemplos de análisis de datos tanto de performance como de comportamiento de los usuarios en un motor de búsqueda que mostró Otis Gospodnetic en “Search Analytics: Business Value & BigData NoSQL Backend”. También merece la pena mencionar la presentación que Marc Sturlese hizo en “Scaling Search at Trovit with Solr & Hadoop”. Fue un placer ver a alguien que también trabaja en Barcelona dar una presentación de este nivel ante la cantidad de asistentes internacionales que había.

El segundo día fue más flojo. La keynote inaugural “Realtime at Twitter”, a cargo de Michael Busch, no llegó a cumplir el nivel de expectiva que había puesto en esta charla. La charla, con un nivel técnico exigente llegó a entrar en mucho detalle en algunos aspectos mientras que otros asuntos del motor de búsqueda de Twitter no fueron prácticamente mencionados. Del resto de charlas destacaría “The Many Facets of Apache Solr” en la que Yonik dio buenos “tips” sobre el uso de facets en Solr y la de “Better Search Engine Testing” a cargo de Eric Pugh. Esta última nos permitió sacar varias ideas y conocer varias herramientas para hacer un testing mucho más profundo sobre el buscador de Emagister.

De la Lucene Eurocon destacaría los siguientes puntos:

- Named Entity Recognition. O lo que es lo mismo: En el momento en el que los usuarios introducen una búsqueda identificar aquellas entitades (personas, empresas, lugares, etc) que son importantes y aplicar mejoras en el buscador a partir de ellas. Por ejemplo: Si identificamos una ciudad, podemos filtrar los resultados por esa ciudad o proporcionar a los usuarios la posibilidad de buscar por proximidad.
- “Mídelo todo”. Conocer como se comportan tus usuarios y su experiencia de búsqueda es básico para saber que tienes que mejorar. Por ejemplo: ¿Conoces cuáles son las búsquedas más populares? ¿Conoces el listado de búsquedas que devuelven 0 resultados?
- USUARIO, USUARIO, USUARIO, USUARIO y USUARIO. Hay que focalizar todos los enfuerzos en conseguir la mejor experiencia de usuario posible. No olvides nunca al usuario.

Antes de despedir la conferencia se hizo un panel abierto en el que podías hacer preguntas a los commiters de Lucene / Solr. Os dejo una foto que saqué en ese momento:

Mereció la pena asistir a la conferencia tanto por el nivel de las presentaciones como por la cantidad de ideas que pudimos extraer que nos van a permitir añadir nuevas mejoras al buscador de Emagister con el objetivo de ofrecer la mejor experiencia de búsqueda a nuestros usuarios.

 

Leave a reply

 

Your email address will not be published.