Visualizando Datos Científicos: Un componente esencial de la investigación

por Anne E. Egger, Ph.D.

Desde la mitad de los años 1600s, cuando Isaac Newton comenzó con el hábito de tomar medidas precisas de los fenómenos que estudiaba, los datos han sido un componente fundamental de cualquier empresa científica. Los científicos de diversos campos recolectan datos de muchas formas diferentes, desde la magnitud y la ubicación de un terremoto, a la longitud de los picos de los pájaros fringílidos, a la concentración de bióxido de carbón en la atmósfera y muchas cosas más. A pesar de que inicialmente los datos son compilados en tablas o bases de datos, posteriormente son inevitablemente presentados en forma gráfica para ayudar a los científicos a visualizar e interpretar la variación dentro de los datos. Esta forma puede ser un gráfico o un gráfico en forma de torta, un mapa o una animación.
data table
Figura 1: Un extracto de una tabla de datos de CO2 atmosférico medido en Mauna Loa. Los datos fueron obtenidas del Centro de Análisis de Información de Dióxido de Carbono. Dar clic en la grafica para ver la tabla completa.
Tablas puras de números pueden ser difíciles de interpretar. Imagínese trata de identificar patrones a largo plazo en esta tabla de datos de concentraciones de dióxido de carbono atmosférico tomada a través de varios años en Mauna Loa (Dar clic en la grafica para ver la tabla completa). Es difícil para la mayoría de las personas entender tanta información numérica. Sin embargo, si tomamos esos mismos datos y los ponemos en un gráfico, se vería así:
Keeling Curve
Figura 2: CO2 Atmosférico medido en Mauna Loa. Este es un famoso gráfico llamado Curva Keeling (cortesía de la NASA).

El eje-x, o eje horizontal, muestra la variable tiempo en unidades anuales, y el eje-y, o eje vertical, muestra la variable de la concentración de bióxido de carbono (CO2) en unidades de partes por millón (ppm). Por consiguiente, el gráfico nos muestra el cambio temporal en concentraciones de CO2 atmosférico. La línea azul oscura muestra el promedio anual de las concentraciones de CO2, tal como aparecen en la columna a la derecha de la tabla. La línea azul clara representa todos los datos numéricos mensuales de la tabla superior. Si un observador perspicaz pudiera deducir de la tabla el incremento promedio anual de las concentraciones de CO2 que aparecen en la línea azul oscura, sería muy difícil, hasta para el más preparado científico, notar el ciclo anual del CO2 atmosférico que la línea azul clara muestra fácilmente.

Poner datos en gráficos es un primer paso. El rol más importante de los gráficos es ayudar a los científicos a interpretar datos. En otras palabras, ¿qué quieren decir en realidad todos esos números? En el gráfico es fácil ver que la concentración atmosférica de CO2 subió sin interrupción, de un bajo de más o menos 315 ppm en 1958 al nivel actual, de más o menos 373 ppm. Dentro de esta tendencia de largo plazo, hay ciclos anuales de más o menos 5 ppm. El siguiente paso en la interpretación consiste en explicar por qué hay un aumento en la concentración atmosférica de CO2 a largo plazo, además de una fluctuación anual. Ahora tenemos que pasar de la lectura del gráfico a ponerlo en contexto. En este caso, los ciclos anuales de más o menos 5 ppm de concentraciones atmosféricas de CO2 están relacionados con los cambios naturales y de estación. Sin embargo, la mayoría de cientifícos está de acuerdo en que los aumentos a largo plazo están relacionados con el aumento de las actividades humanas que emiten CO2, tal como la quema de combustible fósil (ver el módulo Ciclo Carbónico para más información sobre este tema).

Acabamos de seguir un corto procedimiento para extraer mucha información de este gráfico. A pesar de que una infinita variedad de datos pueden aparecer en forma gráfica, este mismo procedimiento se puede aplicar a la lectura de cualquier tipo de gráfico: 1. Describa el gráfico:¿Qué significa el título? ¿Qué está en el eje-x? ¿Qué está en el eje-y? ¿Cuáles son las unidades? 2. Describa los datos: ¿Cuál es la extensión numérica de los datos? ¿Qué tipos de tendencias puede ver en estos datos? 3. Interprete los datos: ¿Cómo se relacionan las tendencias que ve en el gráfico con otras cosas que conoce?

Otras maneras de visualizar datos

Hay otros diferentes tipos de gráficos que se usan para distintos própositos. El gráfico CO2 mostrado anteriormente, es un gráfico de líneas, un tipo muy común de gráfico usado, generalmente, para mostrar cambios en una o más variables que se relacionan con una segunda variable, tal como el tiempo. Estos son algunos ejemplos:

histogram
Figura 3: Los gráficos de barras, o histogramas, son usados para demostrar una distribución de frecuencia. Se los usa sobre todo para comparar. Estas variables se muestran generalmente en el eje-x y la frecuencia en el eje-y.

También podemos seguir el mismo proceso en tres pasos para analizar este gráfico. Paso 1: El gráfico muestra la ascendencia de los residentes de Estados Unidos. Las diferentes ascendencias están en el eje-x, mientras que el número de personas con una ascendencia especifíca se muestran en el eje-y. Paso 2: Las ascendencias más comunes son europeas: inglesa, alemana, irlandesa e italiana, además de americana. Paso 3: Hay varias interpretaciones posibles de estos datos. Primero, el hecho que cuando se consideran en total, muchas más personas declaran una ascendencia europea que americana, lo que revela que los Estados Unidos es un país joven, poblado mayoritariamente por imigrantes. Segundo, la extensión de ascendencias refeja los imigrantes más comunes en este país.

world-seis
Figura 4: Los mapas son usados generalmente para mostrar la distribuición espacial de datos. Este mapa muestra la distribución de terremotos alrededor del mundo (en rojo), y es fácil ver que no están distribuidos al azar.

A pesar de que los mapas son ligeramente diferentes a los gráficos, siguen siendo representaciones gráficas de muchos datos y podemos usar la misma técnica para analizarlos. En este mapa mundial, cada punto rojo representa un terremoto. Los terremotos no están distribuidos al azar - están agrupados en líneas y en ciertas áreas. Esta observación fue usada por los geólogos para interpretar las zonas de alta actividad de terremotos, tales como las placas fronterizas, donde dos piezas de la delgada superficie de la tierra se rozan (ver Placas Tectónicas II para mayor explicación).

Otras formas de visualizar datos son gráficos en forma de tortas y gráficos en tres dimensiones:

pie graph
Figura 5: Un gráfico en forma de torta muestra partes del todo. En este caso, se trata de la población adulta de Estados Unidos, y las partes son el porcentaje de adultos que han completado varios niveles de educación.


3D graph
Figura 6: Un diagrama en tres dimensiones puede conectar tres variables. En este caso, el eje-x y eje-y están relacionados a la latitud y longitud, mientras que el eje-z muestra la concentración de la polución de mercurio en pequeñas zonas dentro del área. Figura adaptada de Opsomer, J.D., Agras, J., Carpi, A., Rodriques, G. (1995) An Application of Locally Weighted Regression to Airborne Mercury Deposition Around an Incinerator Site, Environmetrics, 6:205-219.
Muchas de las áreas de estudio dentro de las ciencias usan gráficos más especializados para tipos de datos específicos. Los biólogos evolutivos, por ejemplo, usan árboles evolutivos para mostrar cómo las especies cambian y evolucionan con el tiempo. Los geólogos usan estereoscopios para mostrar la orientación de las capas de rocas en un espacio tridimensional. En cualquier caso, sin embargo, se aplican las mismas reglas de análisis: describir el gráfico, describir los datos y, después, empezar a interpretar. Estos simples procedimientos aquí descritos, deberían ayudarle a sacar partido de cualquier gráfico en sus estudios científicos. Independientemente del tipo exacto de gráfico, la creación de una visualización clara y comprensible de datos tiene una importancia fundamental en todas las ramas de la ciencia. De la misma manera, la lectura e interpretación de gráficos es una habilidad clave a todos los niveles, desde el estudiante introductorio al científico de investigación. Los gráficos son componentes claves de los trabajos de publicación científicos, en los que los nuevos datos se presentan rutinariamente. Presentar los datos desde donde se sacan conclusiones, le da a los científicos la oportunidad de analizar ellos mismos los datos, un proceso que tiene el próposito de mantener los experimentos y análisis científicos al nivel más objetivo posible. A pesar que las tablas son necesarias para anotar datos, los gráficos le permiten al lector visualizar complejas series de datos de una manera simple y concisa.

Anne E. Egger, Ph.D. “Visualizando Datos Científicos” Visionlearning Vol. SCI-2 (1), 2004.

Top