La semana pasada tuve la suerte de poder asistir a un encuentro donde estuvieron presentes algunos de los mayores expertos en Lucene y Solr del mundo. En el Hotel Meliá de Barcelona se reunieron gente que desarrolla algunas de las más reconocidas aplicaciones en el mundo de los buscadores, así como creadores de herramientas y software que usamos casi a diario.

DIA 1

He de reconocer que ante tanta sabiduría me senti ligeramente acongojado. Temía no enterarme del tema de las diferentes sesiones, pero la primera charla, de la mano de Grant Ingersoll me quito el miedo cuando vi que los puntos que el indicaba son en los que hemos estado trabajando en nuestro equipo los últimos meses. El foco a usuario salió a la luz pronto, y siguió presente durante toda la conferencia. La siguiente Keynote sobre BigData y Clustering se centró en Hadoop, comenzando con una introducción al ecosistema de hadoop (HBase, Zookeeper, …) y explicando en que consisten los MapReduce Jobs.

Después se sucedieron unas cuantas conferencias, intercaladas con desayunos y el almuerzo. Destacaría este primer día la conferencía de Tommaso Teofili sobre Natural Languache Search in Solr. Fue un lleno completo y la verdad que no defraudó, explicó un caso de uso con una web de cine y el uso de UIMA. UIMA añade meta-información a los documento a indexar, marcando, por ejemplo, que Michael J. Fox es un actor, que “Regreso al futuro” es una pelicula, o que “Steven Spielberg” es un director. Previamente Steve Kearns ya nos habia explicado las diferencias entre tokenizer, steemer, lematizer y Servicios tipo UIMA.

Me gustaron también este primer día las conferencias con los casos de uso de Archive-It y Shopping24. Ejemplos reales y variados de crawlers y buscadores donde se ha hecho un gran esfuerzo por mejorar el rendimiento y mantener indices con un gran volumen de datos y estabilidad. Además tanto Aaron Binns como Torsten Koester resolvieron nuestras dudas sin problemas.

Las últimas charlas express y el desafio “Stum The Chump” llegaron tras 8 charlas anteriores, con lo que el cerebro llegaba justito y alguna charla orientada a lavar la imagen de alguna empresa y de vender productos se hizo pesada. Pero al venir acompañadas de un grifo de cerveza y refrescos aguantamos hasta el final (Stum The Chump) donde entre los problemas planteados encontramos algún viejo conocido.

DIA 2

El segundo día comenzo con una conferencia “golosa”. Michael Busch nos explico con bastante detalle como tienen montado su índice de lucene en Twitter, entrando a detalle en la estructura de los términos y su manera de almacenar el reverse-index. Quizás por entrar tanto a detalle al comienzo tuvo que acortar temario al final y los asistentes nos quedamos con ganas de algo más. Las siguientes conferencias sobre Mobile Search y el Solr Explain resultaron algo más pobres, ya que se esperaba algo más de profundidad en el explain, y algun tip mas concreto en la de mobile. De todos modos nos quedamos tanto como con la aplicación que presentó Rafal Kuc de Solr.pl, y los consejos acerca de “se preciso, se concreto” en cuanto a mobile search.

Me gustaron bastante, sin embargo, las otras tres presentaciones. The Many Facets of Solr, con su creador, Yonik Seeley me encantó, ya que aparte de presentar la infinidad de posibilidades y de explicar como crear facets adecuados para filtrar búsquedas, planteó respuestas a algunos problemas con los que ya nos habíamos “peleado” en emagister. Además comentó un problema de rendimiento que casualmente, el día despues tuvimos que tratar en la oficina.

Sobre Using Solr Cloud for Real y Solar@Etsy, decir que fueron ejemplos de uso muy aclarativos, donde se trataron problemas de replicación de indices con metodos tan innovadores como usar bittorrent, o la replicación con multicasting, como habia mencionado Marc Sturlese el día anterior. Fueron charlas amenas que sin entrar en detalle si que dieron varios tips sobre caches, rendimiento, y replicación de índices como ya he mencionado.

Como resumen de esta conferencia me gustaría decir que fue intensa, que aprendi mucho de los pro-s de lucene y solr, y que recomiendo un empacho así al menos una vez al año para todos los que trabajamos en el area de buscadores, de solr, lenguajes naturales, o simplemente cualquiera que le guste el mundo web. Creo que el precio merece la pena ya que lo que se ha visto en esta conferencia son casos reales, problemas reales y soluciones reales que la gente esta usando a diario y que esta encantada de compartir con el resto de javeros (lo siento php-team).

 

Leave a reply

 

Your email address will not be published.