web data mining

Analítica web y usabilidad: condenados a entenderse

Desde que realicé el proyecto final de carrera (Ingeniería informática en la UIB) sobre análisis de logs de servidores web (web data mining), me he preguntado por qué esa disciplina se trataba de un modo tan independiente (y habitualmente por…

Desde que realicé el proyecto final de carrera (Ingeniería informática en la UIB) sobre análisis de logs de servidores web (web data mining), me he preguntado por qué esa disciplina se trataba de un modo tan independiente (y habitualmente por expertos también independientes) al de la usabilidad web. Al fin y al cabo, ¿no se trata de conocer cómo utilizan los usuarios la web? Cuando se dicen cosas como “nuestros usuarios son así”, o “la mayoría de usuarios utilizan más esta funcionalidad”, ¿hasta qué punto se saben realmente?

Cualquiera que haya tratado mínimamente con las técnicas de análisis web sabe que extraer conclusiones del análisis de accesos es mucho más complicado de lo que podría parecer: filtrar bots, identificar usuarios únicos y sesiones,… Las técnicas que se utilizan son siempre heurísticas que dan resultados aproximados y que hay que saber interpretar.

Esquema de accesos web: hits, páginas vistas, sesiones, usuarios

Hasta que hace unos días he leído un artículo en el blog de Xperience Consulting que se plantea si ambas disciplinas son contrarias una a la otra. La respuesta es, obviamente, que no; no son opuestas, sino complementarias. Como dice Avinash Kaushik, la analítica web nos dice QUÉ están haciendo los usuarios, mientras la usabilidad web nos dice POR QUÉ lo hacen.

Por ejemplo, una herramienta de análisis web (como Google Analytics) nos puede indicar que un gran número de usuarios abandonan un proceso de compra de 4 pasos en el tercer paso, pero no nos dirá por qué. Para eso podemos hacer un estudio de usabilidad con usuarios reales y comprobar que no pasan de ese punto porque les obliga a introducir un dato que no entienden.

Sin embargo, en muchas ocasiones estas técnicas son explotadas de manera independiente: el departamento de Sistemas (o el de Márqueting) hace un análisis de los accesos, mientras que por otro lado el departamento de Desarrollo o Diseño web utiliza (si lo hace) técnicas de usabilidad web. Aunque parece que la cosa podría mejorar con nuevas metodologías de desarrollo.

(more…)

Something I still miss in Google Analytics

Google Analytics has a nice new interface, much more intuitive and usable, but I still miss something I think it would be really usefull: an integrated calendar of events. I can select a range of dates at Google Analytics and…

Google Analytics has a nice new interface, much more intuitive and usable, but I still miss something I think it would be really usefull: an integrated calendar of events.
I can select a range of dates at Google Analytics and get different statistics: visits, unique users, etc. But there are many events (internal and external) that may affect that data. For instance:

  • Changes at the site: contents, layout, etc.
  • Changes in Google Analytics configuration (for instance, in filters)
  • Google Adwords campaigns linking to that site
  • etc, etc.

Any webmaster would be happy to know how those events are related to the statistics, wouldn’t they?

How could Google do that? We already have a solution: Google Calendar. So we simply would associate a site monitorized by Google Anlytics to a calendar in Google Calendar. A webmaster could add events to that calendar, and they would be shown at Google Analytics.

Here’s an example; this graph shows a decrease in the number of visits on June, 2nd:

Google Analytics graph (without events)

Hmmm… What happened that day? Oh, maybe that new filter to exclude inner visits. With the feature I suggest, I would link the Google Analytics account with a Google Calendar which includes events related to the site, like this:
(more…)

En el USID’07 de Barcelona

El pasado lunes 23 de mayo estuve en Barcelona en la 4ª Jornada de Usabilidad en Sistemas de Información Digital (USID’07). Sobre las diferentes ponencias de la mañana y el seminario de la tarde he escrito en el blog del…

El pasado lunes 23 de mayo estuve en Barcelona en la 4ª Jornada de Usabilidad en Sistemas de Información Digital (USID’07). Sobre las diferentes ponencias de la mañana y el seminario de la tarde he escrito en el blog del grupo SQUaC.

En un aspecto más personal, hay varias cosas que tengo que destacar:

Tengo la impresión de que la mayoría de los asistentes pertenecían al mundo de la biblioteconomía y la documentación, y no tanto al mundo técnico (una de las pistas era la gran proporción de público femenino). Es curioso ver cómo a la usabilidad se llega desde diferentes ámbitos: la informática, la psicología, la documentación…

Peter Morville, la “estrella” de la jornada y autor de un conocido libro sobre Arquitectura de Información (Information Architecture for the World Wide Web ), mostró algunas versiones “alternativas” de la portada de su libro. Si no le entendí mal, sugirió que podría hacerse lo mismo para una versión española. Esta es la versión original:

Information Architecture for the World Wide Web

Y estas son mis propuestas para la versión española:

Information Architecture for Spanish (lynx)Information Architecture for Spanish (bull)

El lince está bien como animal representativo, ¿no? Además, ya que está en peligro de extinción… Y el toro es un dibujo de Picasso, así que supongo que eso anula cualquier implicación política que uno pudiera tener (siempre hay quien la encuentra).

Por último, una de las ponencias (Minería web para mejorar sitios web, por Ricardo Baeza-Yates, de Yahoo! Research) me sonó muy familiar: trataba del análisis del comportamiento de los usuarios para mejorar el diseño de los sitios. Es decir, el tema del que trató mi proyecto final de carrera. No hubo tiempo para preguntas, así que me quedé con las ganas de exponerle alguna cuestión; por ejemplo, ¿cómo influirán técnicas como Flash y AJAX en esos estudios? Imagino que bastante, y no de forma positiva.

En resumen, siempre resulta interesante asistir a este tipo de eventos, tanto por lo que ves y oyes, como por lo que se te ocurre mientras estas ahí.

[Actualización 30-may-2007]

Le envié las imágenes a Peter Morville, el autor del libro, que me comentó sus preferencias por el toro :) ¡Incluso lo ha incluido en su blog!

Proyecto fin de carrera: análisis de logs web

El pasado lunes, 15 de mayo, presenté en la UIB el proyecto fin de carrera de la Ingeniería en Informática, que tenía pendiente desde que terminé todas las asignaturas en 1996; cuando uno empieza a trabajar cuesta dedicarle horas a…

El pasado lunes, 15 de mayo, presenté en la UIB el proyecto fin de carrera de la Ingeniería en Informática, que tenía pendiente desde que terminé todas las asignaturas en 1996; cuando uno empieza a trabajar cuesta dedicarle horas a algo por lo que no te pagan. :)

Esquema de conceptos en el análisis de logs webEl proyecto se titula Análisis de accesos a un servidor web de contenidos dinámicos; en pocas palabras, trata de la aplicación de técnicas de minería de datos (web data mining) a los logs de los servidores de Internet e Intranet de la empresa donde trabajo, “SA NOSTRA” para conocer el comportamiento de sus usuarios; su característica más destacada es que son servidores dinámicos (en concreto, basados en Lotus Notes / Domino).

(more…)