Libros sobre analítica web que debes leer

2

Al pensar en analítica web los primeros nombres que suelen desplegarse en nuestro “buscador” mental son los de figuras como Avinash Kaushik, Gemma Muñoz, Tristán Elósegui, Eric Peterson, Adam Greco, Justin Cutroni o Dan Zarella.
Todos ellos merecen ocupar la parte alta de la pantalla del buscador para las keywords “web analytics”, pero dado que la tarea del analista digital, además del análisis y el mundo web, implica el conocimiento y la capacidad de evaluar otros aspectos muy diferentes, el tránsito de aprendiz de analista web a analista profesional requiere que este vaya “amueblando” su cabeza con ciertas piezas básicas de distintas formas y tamaños.
Veámoslo en detalle. La tarea del analista web implica habilidades tales como: conocimientos de estadística, de software de recogida y tratamiento de datos, de comportamientos, nociones sobre arquitectura web y usabilidad más cuarto y mitad de código, conocimiento de los resortes del mundo de los negocios así como de marketing y publicidad, saber medir, visualizar e interpretar los datos y ser capaz de dar recomendaciones relevantes y certeras en cuanto a negocio.
En esta nueva sección o serie de mi blog llamada “Cartas a un joven analista” iré recomendando libros que me parecen imprescindibles para introducirse con garantías en el mundo de la analítica digital.
Uno de los aspectos fundamentales es la estadística, ya que el analista digital necesita entender cómo funcionan los grandes números, las tendencias y factores como la media, mediana, moda y otros elementos de estadística básica. Existen distintos libros introductorios que explican estos conceptos, con distintos enfoques y mayor o menor acierto. Hoy me gustaría recomendar “Cómo mentir con estadísticas” de Darrell Huff porque me parece un libro magnífico.

Cómo mentir con estadísticas
Título original: “How to Lie with Statistics” (primera edición en inglés 1954)
Traducción:  (1965) Octavio Freixas Ortega
Ilustraciones de Irving Geis
Editorial Crítica. Junio 2011
146 páginas.

Portada de la versión original del libroCubierta del libro en su edición en castellano

 

Se trata de un libro clásico publicado en 1954 pero plenamente vigente en 2015. Tiene un título un poco engañoso, ya que en realidad también se podría llamar “Cómo asegurarse de que las estadísticas no mienten”. Es un texto corto y delicioso, con dibujos de Irving Geis que realmente ilustran y con un breve glosario. La traducción al castellano de Octavio Freixas Ortega es magnífica, pese a que es de 1965 y que tiene algún desliz puntual.

A los aspirantes a analistas que cuenten ya con una buena base estadística el libro no les enseñará nuevos conceptos, pero les servirá para refrescarlos, les ayudará a explicarlos de forma inteligible a sus jefes o clientes y les hará pasar un rato de lectura estupendo.
El texto de la solapa del libro indica que según la revista “Statistical Science” este título es el libro de esta temática más vendido de la segunda mitad del siglo XX. No he comprobado la fuente ni los datos en que se basa la revista para afirmarlo, pero lo que sí puedo decir de primera mano es que este libro de Huff es una  lectura deliciosa. Bien escrito, ameno, divertido, trufado de ilustraciones bien elegidas y esclarecedoras, va desmotando errores comunes en la interpretación de datos partiendo de ejemplos cotidianos (las propiedades de la pasta de dientes y los cereales del desayuno, los percentiles de crecimiento de los niños, la utilidad de ciertas vacunas, el escurridizo concepto de “normal”) y muestra de manera clara los requisitos de todo análisis estadístico para ser tenido en cuenta.

 

Ejemplo de fragmento “delicioso” del libro:

“Si no le importa, empezaré atribuyéndole dos hijos. A Pedro y a Linda (podríamos haberles puesto nombres que estuviesen más de moda) les han pasado un test de inteligencia, como se hace con otros muchos niños en el transcurso de sus años escolares…”. (Op. Cit. pag 47)

 

El libro incluye una introducción, 10 capítulos y un breve glosario de 18 términos. A continuación reproduzco el título de los capítulos en cursiva y un breve resumen de su contenido:

1.    La muestra que presenta un valor de influencia en sí misma – Sobre la importancia de la muestra
2.    El promedio bien escogido – Sobre la importancia del tipo de promedio elegido (media, mediana y moda)
3.    Las pequeñas cifras que no aparecen – Errores por muestras demasiado pequeñas
4.    Mucho ruido y pocas nueces – Error probable, desviación estándar y diferencias no significativas
5.    El gráfico exclamativo – Cortar gráficos, modificar proporción entre abscisas y ordenadas o exagerar la incidencia de un factor
6.    El personaje de la gráfica – iconos no proporcionales o que suscitan malinterpretaciones (vaca creciente, bolsa del carpintero dos veces más grande)
7.    La cifra indirectamente relacionada – si no puede demostrar lo que quiere, demuestre otra cosa y haga ver que es lo mismo.
8.    El “post hoc” aparece de nuevo – una correlación no es una causa
9.    Cómo “estadistiquear” – Cómo informar mal usando estadísticas descuentos calculados sobre el precio final, no indicar la forma de calcular un beneficio, sumar porcentajes como si fueran unidades.
10.    Cómo enfrentarse con las estadísticas – lista de comprobación para validar una estadística: 1 quién lo dice, 2 cómo lo sabe, 3 qué falta (número de casos, error probable, desviación estándar, tipo de promedio, término de comparación; si ofrecen estadística, cuál es el material numérico de base); 4 ¿dio alguien cierto giro a la información? 5 ¿tiene sentido?

 

El gráfico siguiente recoge los términos del glosario de la parte final de How to Lie with Statistics.

Glosario de términos estadísticos del libro de Huff

Nube de tags con los términos del glosario de Huff

También te puede interesar:

Share.