Category Archives for "analítica web"

Cómo mentir con estadísticas, un libro clásico
Nov 09

Libros sobre analítica web que debes leer

By admin | analítica web , digital , economía , libros , negocio , publicidad , recomendado

Al pensar en analítica web los primeros nombres que suelen desplegarse en nuestro “buscador” mental son los de figuras como Avinash Kaushik, Gemma Muñoz, Tristán Elósegui, Eric Peterson, Adam Greco, Justin Cutroni o Dan Zarella.
Todos ellos merecen ocupar la parte alta de la pantalla del buscador para las keywords “web analytics”, pero dado que la tarea del analista digital, además del análisis y el mundo web, implica el conocimiento y la capacidad de evaluar otros aspectos muy diferentes, el tránsito de aprendiz de analista web a analista profesional requiere que este vaya “amueblando” su cabeza con ciertas piezas básicas de distintas formas y tamaños.
Veámoslo en detalle. La tarea del analista web implica habilidades tales como: conocimientos de estadística, de software de recogida y tratamiento de datos, de comportamientos, nociones sobre arquitectura web y usabilidad más cuarto y mitad de código, conocimiento de los resortes del mundo de los negocios así como de marketing y publicidad, saber medir, visualizar e interpretar los datos y ser capaz de dar recomendaciones relevantes y certeras en cuanto a negocio.
En esta nueva sección o serie de mi blog llamada “Cartas a un joven analista” iré recomendando libros que me parecen imprescindibles para introducirse con garantías en el mundo de la analítica digital.
Uno de los aspectos fundamentales es la estadística, ya que el analista digital necesita entender cómo funcionan los grandes números, las tendencias y factores como la media, mediana, moda y otros elementos de estadística básica. Existen distintos libros introductorios que explican estos conceptos, con distintos enfoques y mayor o menor acierto. Hoy me gustaría recomendar “Cómo mentir con estadísticas” de Darrell Huff porque me parece un libro magnífico.

Cómo mentir con estadísticas
Título original: “How to Lie with Statistics” (primera edición en inglés 1954)
Traducción:  (1965) Octavio Freixas Ortega
Ilustraciones de Irving Geis
Editorial Crítica. Junio 2011
146 páginas.

Portada de la versión original del libroCubierta del libro en su edición en castellano

 

Se trata de un libro clásico publicado en 1954 pero plenamente vigente en 2015. Tiene un título un poco engañoso, ya que en realidad también se podría llamar “Cómo asegurarse de que las estadísticas no mienten”. Es un texto corto y delicioso, con dibujos de Irving Geis que realmente ilustran y con un breve glosario. La traducción al castellano de Octavio Freixas Ortega es magnífica, pese a que es de 1965 y que tiene algún desliz puntual.

A los aspirantes a analistas que cuenten ya con una buena base estadística el libro no les enseñará nuevos conceptos, pero les servirá para refrescarlos, les ayudará a explicarlos de forma inteligible a sus jefes o clientes y les hará pasar un rato de lectura estupendo.
El texto de la solapa del libro indica que según la revista “Statistical Science” este título es el libro de esta temática más vendido de la segunda mitad del siglo XX. No he comprobado la fuente ni los datos en que se basa la revista para afirmarlo, pero lo que sí puedo decir de primera mano es que este libro de Huff es una  lectura deliciosa. Bien escrito, ameno, divertido, trufado de ilustraciones bien elegidas y esclarecedoras, va desmotando errores comunes en la interpretación de datos partiendo de ejemplos cotidianos (las propiedades de la pasta de dientes y los cereales del desayuno, los percentiles de crecimiento de los niños, la utilidad de ciertas vacunas, el escurridizo concepto de “normal”) y muestra de manera clara los requisitos de todo análisis estadístico para ser tenido en cuenta.

 

Ejemplo de fragmento “delicioso” del libro:

“Si no le importa, empezaré atribuyéndole dos hijos. A Pedro y a Linda (podríamos haberles puesto nombres que estuviesen más de moda) les han pasado un test de inteligencia, como se hace con otros muchos niños en el transcurso de sus años escolares…”. (Op. Cit. pag 47)

 

El libro incluye una introducción, 10 capítulos y un breve glosario de 18 términos. A continuación reproduzco el título de los capítulos en cursiva y un breve resumen de su contenido:

1.    La muestra que presenta un valor de influencia en sí misma – Sobre la importancia de la muestra
2.    El promedio bien escogido – Sobre la importancia del tipo de promedio elegido (media, mediana y moda)
3.    Las pequeñas cifras que no aparecen – Errores por muestras demasiado pequeñas
4.    Mucho ruido y pocas nueces – Error probable, desviación estándar y diferencias no significativas
5.    El gráfico exclamativo – Cortar gráficos, modificar proporción entre abscisas y ordenadas o exagerar la incidencia de un factor
6.    El personaje de la gráfica – iconos no proporcionales o que suscitan malinterpretaciones (vaca creciente, bolsa del carpintero dos veces más grande)
7.    La cifra indirectamente relacionada – si no puede demostrar lo que quiere, demuestre otra cosa y haga ver que es lo mismo.
8.    El “post hoc” aparece de nuevo – una correlación no es una causa
9.    Cómo “estadistiquear” – Cómo informar mal usando estadísticas descuentos calculados sobre el precio final, no indicar la forma de calcular un beneficio, sumar porcentajes como si fueran unidades.
10.    Cómo enfrentarse con las estadísticas – lista de comprobación para validar una estadística: 1 quién lo dice, 2 cómo lo sabe, 3 qué falta (número de casos, error probable, desviación estándar, tipo de promedio, término de comparación; si ofrecen estadística, cuál es el material numérico de base); 4 ¿dio alguien cierto giro a la información? 5 ¿tiene sentido?

 

El gráfico siguiente recoge los términos del glosario de la parte final de How to Lie with Statistics.

Glosario de términos estadísticos del libro de Huff

Nube de tags con los términos del glosario de Huff

También te puede interesar:

Oct 28

Cómo transformarán los datos el negocio

By admin | analítica web , comunicación , digital , economía , negocio , portada , recomendado

En la charla TED que aparece a continuación, Philip Evans explica los cambios que se van a producir en el mundo de los negocios como consecuencia de los datos. El video es en inglés con subtítulos en español.

 

Aquí va mi pequeño resumen de la charla de Evans, en forma de ideas-fuerza.

  • La estrategia de negocio ha cambiado al cambiar la tecnología.
  • El concepto de estrategia de negocio se basa en las aportaciones de Bruce Henderson y Michael Porter.
    • Henderson tiene un enfoque “napoleónico” y militar, que consiste en aglutinar una gran masa para vencer al enemigo débil. Conceptos básicos: retornos crecientes, escala, experiencia. Según su enfoque, la ventaja competitiva se obtiene siendo más numeroso y acumulando más experiencia.
    • Porter comparte algunos aspectos de la visión de Henderson pero la enriquece y matiza con conceptos como la cadena de valor, que está compuesta por distintos elementos (desde la materia prima hasta el producto final). A cada uno de los elementos hay que aplicarle una estrategia distinta. La ventaja del producto final será la suma de la media de la ventaja de las partes. Concepto clave: costes de transacción.

Los costes de transacción tienen dos componentes fundamentales:

  • El procesamiento de la información.
  • La comunicación (estos costes han bajado mucho a partir de 1995).

Los costes de transacción son el “pegamento” que mantiene unidas las cadenas de valor. Al bajar su precio, disminuye la necesidad de contar con organizaciones verticales y las cadenas de valor pueden romperse (aunque no es necesario que se rompan). Por ejemplo, un competidor puede usar su posición en uno de los puntos de la cadena de valor para penetrar, atacar o “desintermediar” en otro punto a su competidor. Un ejemplo de esto es el caso de las enciclopedias tradicionales y su sustitución por Wikipedia.

 

Economía

Transacción económica (Fuente: Pixabay)

 

Enciclopedias en papel versus Wikipedia

La parte más costosa del negocio tradicional de las enciclopedias en papel era la distribución, pero con la aparición de los CD e Internet la distribución del conocimiento se abarató mucho.

La parte clave de Wikipedia como negocio es la producción, el hecho de que sean los propios usuarios quienes crean el contenido (2ª generación de internet). Ya no hace falta la estructura institucional anterior, porque los individuos pueden producir contenidos sin ella. De esta manera se derrumban las economías de escala.

 

La tecnología está cambiando la estrategia de negocio

La tecnología está cambiando la estrategia de negocio (Fuente: Pixabay)

Repercusión de los datos masivos en los negocios

La tecnología está llevando la escala natural de las actividades más allá de los límites institucionales tradicionales y está redefiniendo la estrategia de negocio.

La competencia vertical se ha convertido en horizontal porque los gastos de transacción se han desplomado debilitando el “pegamento” que mantenía unida la cadena de valor, hasta el punto de que ésta se empieza a separar y la escala se está polarizando en torno a dos extremos opuestos: por una parte, algunas comunidades muy pequeñas están sustituyendo la producción corporativa tradicional y por otra cobran fuerza actividades como el big data que están solo al alcance de las grandes empresas.

Hoy en día la definición del negocio y del sector es resultado de la estrategia y no al revés como solía ser. Tenemos que descubrir la forma de compaginar el enfoque colaborativo con el enfoque competitivo, lo muy grande con lo muy pequeño (como ocurría con el genoma), las distintas motivaciones de los individuos dentro de las corporaciones con las motivaciones sociales de las propias instituciones.

Evans concluye diciendo que nuestra concepción de la estructura de negocio debe cambiar mucho.

 

También te puede interesar:

 

Oct 26

Precisión versus exactitud en analítica web

By admin | analítica web , comunicación , digital , publicidad , recomendado , redes sociales

¿A quién quieres más, a mamá o a papá?

Uno de los dilemas a la hora de medir datos en analítica digital es elegir entre un enfoque que prime la precisión (precision) y otro que se decante por la exactitud (accuracy). Así lo comenta Avinash Kaushik en su libro “Web Analytics 2.0. The Art of Online Accountability & Science of Customer Centricity” [pg. 284]  e ilustra la diferencia mediante dos dianas con impactos distribuidos de la forma siguiente.

 

Dianas precisión frente exactitud

Diana de la precisión y diana de la exactitud (Wikipedia Commons)

 

Kaushik define accuracy como: “how close to perfect you can get”, es decir, hasta qué punto tu medición se acerca a la perfección de la exactitud total y precision como “the degree to which your efforts yield the same results”, es decir, el grado en que tus esfuerzos de medida obtienen los mismos resultados.

Como se ve, en la diana izquierda los lanzamientos han quedado más cerca del centro (y por tanto del objetivo), lo que supone mayor exactitud respecto al objetivo, mientras que los disparos de la diana derecha están más alejados del centro, pero más juntos entre sí, lo que supone una mayor capacidad para predecir dónde “aterrizará” el tiro.

El siguiente gráfico ilustra distintas combinaciones de exactitud-precisión y sus implicaciones.

Ilustración con cuatro casos

Ilustración con cuatro casos (fuente)

 

Evidentemente, lo ideal sería poder contar con un enfoque de gran precisión y gran exactitud para nuestros datos, pero en el mundo real hay que priorizar uno u otro enfoque. La conclusión de Avinash es que es preferible elegir la precisión porque esta nos garantizará  poder predecir dónde van nuestros “disparos”, mientras que si nos polarizamos hacia lo que es exacto (accurate), no solo no seremos exactos, sino que además no podremos prever nuestra desviación.

Con un modelo mental de precisión, prosigue Avinash, el analista sabe dónde es posible que termine cada disparo y a qué distancia de su objetivo lo va a hacer. Si ofrecemos este enfoque a los encargados de tomar las decisiones esto permitirá una toma de decisiones más rápida y obtener impactos predecibles para nuestros resultados. Así pues -concluye el experto en analítica web- conviene empezar centrando la estrategia de datos en las áreas en las que uno pueda ser preciso.

También te puede interesar: