El clic de los niños

“Los niños ya nacen sabiendo usar internet”, oímos a menudo. Lo que seguramente no saben es cómo proteger su privacidad de la personalidad que aún están formando, porque ya hay aplicaciones y trackers juntando datos de su navegación. Esto es lo que descubrió un grupo de investigadores del International Computer Science Institute (ICSI) de la Universidad de Berkeley.

¿Para qué querría alguien hacer un perfil del comportamiento de un niño pequeño? fue lo primero que le pregunté a Narseo Vallina, uno de los investigadores, y sus respuestas no fueron muy tranquilizadoras. Disney ya ha tenido juicios por temas similares y hace poco YT Kids se enfrentó a un inmenso debate en redes por padres preocupados. Había una serie de vídeos producidos por algoritmos programados para crear vídeos terriblemente atractivos para menores, aunque ciertamente extraños. Lo peor de todas estas apps es que la mayoría enviaba los datos a terceros, en la mayoría de los casos, empresas bastante oscuras. Todo esto y más lo he contado en este reportaje para El País: Más de la mitad de aplicaciones infantiles envía datos a terceros.

Foto: Petras Gagilas

Body mass index: not (only) a matter of income

This entry is part of some findings in the exercises for the MOOC
Data visualization for storytelling and discovery. 

Excess body weight is an important risk factor for mortality and morbidity from cardiovascular diseases, diabetes, cancers, and musculoskeletal disorders. It’s the cause of nearly 3 million annual deaths worldwide. Several studies on diferent levels show that adiposity, as measured by body mass index (BMI, calculated as weight in kg over m2), has increased in recent decades in many populations although BMI seems to have been stable or even decreased in some groups.

Body mass index is a value derived from the mass (weight) and height of an individual. The BMI is defined as the body mass divided by the square of the body height. 

Commonly accepted BMI ranges are: underweight: under 18.5 kg/m2, normal weight: 18.5 to 25, overweight: 25 to 30, obese: over 30. Also the World Health Organization adheres to this classification.  So those are the line highlights in the Y axis of the graphs, to see which and how many countries fall into them. 

Correlation with income

I used the Gapminder 2012 dataset to explore a bit. 

The mean BMI provides a simplified measure of the comparative weight of populations on a country by country basis, and my first hunch was to compare the mean BMI of each country with the income per person to see how it correlates. Maps didn’t show well the gradients, as the countries that have higher values of BMI are scarce and very small in dimensions in the map. So I used a scatterplot to see countries and also continents by colour, and see the trends. 

Graph 1: BMI vs. income (men)


All the countries with an obese population (Nauru, Tonga, Samoa, Palau, French Polynesia) belong to the Polynesia, which may pose the question for an ethnic condition or if it’s considered necessary to use diferent parameters when studying this area. 


Graph 2: BMI vs. income (women)


Considering the data for women, there are more countries with more BMI index for women, and also more into the category of obesity. Besides the mentioned before, there’s Kiribati, Marshall Islands for the Polynesian, Egypt and Kuwait for Middle East and Puerto Rico, Saint Kitts and Nevis, and Bermuda for America. This may have some kind of relationship with climate and hot temperatures (?), as all of them are located near the parallel of latitud 0. Some possible clue to keep on searching. 

We can see that the BMI and the income doesn’t show a clear correlation in general, so I thought it would be better to filter and to analyse by continent and country more in detail. 

There are several studies stating that wealth doesn’t have a direct correlation with BMI as there are more factors involved. “The persistence and emergence of income gradients suggests that disparities in weight status are only partially attributable to poverty and that efforts aimed at reducing disparities need to consider a much broader array of contributing factors”, as per Wang and Lauderdale.

In a study of the University of North Carolina, they employed microdata from China to provide the theoretical examination and empirical test of the predictions linking household income to adult BMI using both cross-sectional and panel data analysis. The results show an inverted-U shaped relationship between BMI and family income. Additional income brings about higher BMI and higher possibility of being overweight or obese for the poor than for the rich.


The median of the income per person in the Gapminder data for 2012 is only 14,460, and most of the African countries are under that median. But the rest of the countries are quite dispersed, specially in the case of East Asia and Pacific and South Asia.

The discrepancy with Asia has some particular condition. The WHO has determined that at any given BMI, Asians, including Singaporeans, generally have a higher percentage of body fat than do Caucasians. The BMI cut-off levels for Singaporeans have been revised such that a BMI 23 kg/m2 or higher marks a moderate increase in risk while a BMI 27.5 kg/m2 or more represents high risk for diabetes and cardiovascular diseases. 


Besides that, and coming back to all the continents data, a histogram showed that the median for BMI is 25.56, similar to the mean, 25.14. 

So in our analysis, most of the countries fall into the calification of overweight or obese, and as per several experts that’s the biggest problem in terms of alimentation that we have. More than underweighted we are eating bad food and not keeping a good metabolism balance. Also if you are poor and don’t have education you cannot resolve this situations to get the best nutrients and sustainable food at your hand. Education is one of other many variables that can have incidence in the causes of a higher BMI, such as ethniticity, and we cannot establish a serious correlation without searching deeper in other variables.  

Correlation with urban population

So I wanted to watch how urban population could correlate with the BMI index. Some studies at the national level find the lifestyle of urban people as one of the main causes of higher levels of obesity in cities, independently of income. It’s the case of a study in Brazil that found that urbanization and the more developed geographic regions were positively associated with the prevalence of overweight/obesity and negatively associated with the prevalence of underweight.

Graph: Body mass index vs. urban population 

In the grid of scatterplots by continent, we can effectively see a positive correlation for every group. The Asian look still very spread out, anyway. I’d study them in particular, after revising more papers on their specificities, and wouldn’t include them in a general analysis like this. But for the rest, the correlation is positive. 

There are a number of reasons for the association between obesity and economic growth in many economies. Technological changes that lead to the lower food prices and increased food consumption are some of the factors that explain economic growth and obesity, as a study by Finkelstein and Ruhm proved. Those factors increase working hours, which makes more people eat in restaurants and fast food joints.

I find this kind of explorations makes us pose more and more questions every time, and I could go on an on trying to find papers on each region and different variables, as I mentioned before, such as education, urban growth (not only total population), differences per latitudes, and so on.

Exploring datasets: Bikes in Madrid and education expenditure in Argentina

During last weeks I’ve been doing a MOOC on Data visualization for storytelling and discovery with Alberto Cairo, which I intensely recommend. I’ll post here some of the findings I’ve got from there. The studies are not totally finished as they would need more work to be presented as a journalistic piece, so shouldn’t be taken as more than an exercise in the learning process. 


 1. Dataset BiciMad

First, I wanted to go local, and I live in Madrid. In my city we have a relatively new public bike rental service, and they have their datasets available, so I got a dataset with the data on the new daily users.


In the histogram I can see the concentration and the spread of the data. There’s a curious outlier that corresponds with the maximum value of the dataset: 1446 and there’s another isolated value around 700. I find those two points like something worth of more research. Probably they correspond to the day that the service started or went open to the public. 

The x axis represents the number of new users of annual tickets per day. The y line represents the number of days that those users where registered. The distribution is skewed to the right, due to the outliers to the higher values of annual passes some few (2-6) days. 

The box plot shows the concentration of what could be a usual number of new users per day. The median is 132 and the mean is 133, so during that year (2014) that is the number of new users per day of this service. It could be useful to compare it with datasets of other years and other kind of information to see what variables make people decide to hop on bikes as a way of transportation in the city. 


2. Second case: Comparing education expenditure (%) with GINI Index in the last years in Argentina

I was born in Argentina, and there we have been having not very good official statistics in the last years in terms of transparency, so getting good analysis on that kind of data is usually extremely complicated. 

So I used data of the World Bank on three variables: total government expenditure on education, school enrollment primary private and GINI index. I know GINI is made of several indicators and not only education but I wanted to give it a try and see how it correlates. 


I used data from 1980 to 2015. The highest expenditure in education in general was in 2015, with 5.875 % of the GDP. In 1980 there is an outlier point with 2,6 % of GDP expended before a dark period of 15 years where there are no registry or the data we have goes below 2,6 %. 

From 1996 the line rises and shows a positive evolution until the last year in the series (2015), with some hiccup between 2002 and 2005, the years of the default crisis and political unstability in Argentina. The trend overall is positive, with a rank correlation of 0.86  (using Spearman’s Rank Correlation). 

The GINI index is the most commonly used measurement of inequality. A Gini coefficient of 1 (or 100%) expresses maximal inequality among values. So if the GINI index goes down it’s best in terms of equality for the country. For OECD countries, in the late 20th century, considering the effect of taxes and transfer payments, the income Gini coefficient ranged between 0.24 and 0.49.

When I added the GINI index using the colors in the values, I found that there’s a positive correlation, as in the last years where the expenditure on education is higher, the GINI index goes down (which means that Argentina gets closer to equality). There are some quite interesting periods of time, anyway, when this correlation does not happen. 

One is during 1980-1990 the expenditure was lower, quite less than 2,6%, and the GINI index kept below 45. It should be said that we have some missing values those years, and we should investigate further to reach any conclusion. 

The other is an outlier in 2001, when the government expenditure on education is 4.833740234, the highest in the period until 2009, but the GINI index in that year is the highest of the total number of observations, that is very bad for the equality in the country. I find this observation interesting as 2001 is one of the worst years of the crisis, when Argentina went into financial default. 

Mujeres programadoras contra los estereotipos

Hace unos días estuve en Villaverde, en La Nave -este lugar tan diáfano de la foto- para ver cómo era un evento de data science con visión de género. El Call of Data consiste en charlas de expertas y un datatón, y está organizado por las R-Ladies.

Después de leer su código de conducta (échenle un vistazo) una se podría preguntar qué tiene que pasar en estos entornos para que estas medidas sean necesarias. Pero esa pregunta no llega, porque todas sabemos lo que pasa. No hace falta decirlo, y ellas ya conocen el ecosistema: hay tan pocas mujeres en carreras de informática que las que llegan se enfrentan a ambientes hostiles y terminan yéndose. Lo que sí saben es que aprenden mejor en entornos donde se fuerza al menos una paridad, y por eso cada vez hay más comunidades tech que promueven a mujeres para que aprendan programación, para que se animen a subir a un escenario a contar lo que saben, para que no tengan temor a ponerse un vestido si van a un evento tecnológico.

Hablé con ellas, con desarrolladoras de otras comunidades tech, con profesoras de universidad de estas carreras, con programadoras que llevan 20 años trabajando para diferentes empresas, con estudiantes de informática que organizan un evento tecnológico universitario multitudinario, con emprendedoras que trabajan con otras desarrolladoras para formar su propia startup, y todos tienen mucho para contar sobre esas cifras tan bajas de mujeres en carreras STEM. Esas cifras, los estudios que buscan explicarlas y los testimonios están en este reportaje que me ha publicado esta semana El PAÍS: Mujeres programadoras contra los estereotipos: adivina quién va ganando.


Nan Robertson fue la periodista del New York Times que en su libro “The Girls in the Balcony” contó la historia interna de la lucha de las mujeres del Times por un tratamiento igualitario en el periódico. El balcón en cuestión está en el salón de bailes del Club de Prensa Nacional de Washington, que hasta 1955 prohibía a las periodistas mujeres entrar, y hasta 1971 unirse al club.

La única forma que tenía una reportera mujer de cubrir un discurso presidencial era ubicándose en aquel balcón sobre el salón. Así que cuando el presidente hablaba, las mujeres periodistas se amontonaban en ese pequeño espacio, entre los técnicos y los cables. Esas eran las chicas del balcón.

Dijo Michelle Bachelet una vez que cuando una mujer entra en política cambia la mujer, pero cuando muchas mujeres entran en política, cambia la política. Si pensamos en medios de comunicación, quizás es lo que nos haga falta para volver a un periodismo inclusivo.

Un sector en el que el 47% de las periodistas son mujeres no puede tener un ratio de directivas que no llega al 20 %, por razones de productividad y eficiencia, y también de representatividad, de justicia.

Es necesario promover el liderazgo de la mujer en medios de comunicación.

Con este objetivo nace hoy un proyecto que lleva 2 años in the making: el Balcony Group. Está formado inicialmente por nueve periodistas, entre las que me han invitado a formar parte: Ana Pardo de Vera (directora de Público), Soledad Gallego-Díaz (directora de El País), Montserrat Domínguez (directora de revistas de PRISA), Pepa Bueno (Directora Hoy por Hoy –SER), Ana Romero (periodista y escritora), Charo Marcos (directora de Kloshletter), María Ramírez (Nieman fellow), y Mirta Drago (directora de comunicación de Mediaset), y yo. En la foto, algunas de ellas estamos en el balcón del salón de International Institute donde se hizo el panel de Liderazgo de Mujeres en Medios hoy, como un improvisado tributo a esas chicas del balcón que lo cambiaron todo en el New York Times.

Mujeres periodistas líderes se suman a la primera línea de la batalla por la igualdad (Público)

Facebook, tenemos un problema

Muchos quieren ver a Facebook arder. También a Cambridge Analytica, qué duda hay. Hay una fila masiva para poner en duda el triunfo de Donald Trump, y otra en Europa para cuestionar el del Leave en el Brexit. Pero el gran problema que se ha revelado esta semana excede a una sola compañía, por más grande que sea; a un solo presidente, por más que sea el del país más poderoso del mundo; y a un proceso político en la Unión Europea. Estamos teniendo un problemón con nuestra democracia, la privacidad y la libertad de nuestros ciudadanos. Todo eso junto y mezclado.

Explico por qué hoy en un largo análisis para El Huffington Post.

Cómo ser una chica en Internet

Sucedía tanto que ya no lo veías. En todos los eventos tecnológicos eras de las pocas chicas que andaba por ahí. Probablemente hubieses pensado que a las otras no les interesaban estos temas. Eso, si te hubieras preguntado por qué había tan pocas mujeres. Pero enseguida te hubieras dado cuenta de que no era eso. Lo peor no era la respuesta, lo tremendo era que no alcanzabas a hacerte la pregunta.

O te invitaban a mesas de chicas, y te sentías incómoda pero no terminabas de entender por qué, te decían que deberías estar agradecida de que te invitaran. El organizador al final era un tipo majo, había pensado en ti. Escribías en tu blog sobre eso y al publicar te sentías una ingrata despreciable. Otros también lo creían porque luego te caían críticas, y eso siguió sucediendo en otros congresos, más grandes, más importantes, más conocidos, pero ya no volviste a escribir sobre ellos para no dejarlos mal.

Yo me movía en un mundo que admiraba a Silicon Valley. No era impensable cuestionarlo, es que en algunos grupos de gente si no pensabas de esa manera, si no veías las cosas como ellos, estabas fuera.

En este número de La Marea, dedicado al #MeNeither (A mí tampoco), han planteado a varios hombres notables una serie de situaciones que a las mujeres nos son terriblemente familiares. ¿Alguna vez al expresar su opinión con firmeza le han recriminado que es un mandón? ¿Ha sido acosado sexualmente? ¿Suele sentir miedo al volver a casa solo de noche? ¿Cree que alguien asocia su éxito profesional a relaciones sexuales con mujeres con poder? Cada “no” que dicen es un flash que debería abrirnos los ojos y mostrarnos en qué consisten los privilegios de ser hombre todavía hoy.

En este número me preguntan por mi experiencia en entornos tecnológicos y me meto con el Mobile World Congress, pero sólo porque es un evento donde se pueden ver muchas de estas cosas más fácilmente, y también el más mediático y que más a mano tengo. Lo que cuento ahí sucedía tantas veces y en tantos otros congresos que era mi normalidad, hasta que un día decidí dejar de preocuparme por lo que dijeran y llamar a las cosas por su nombre, aunque no fuera cool.

En este número de La Marea: Cómo ser una chica en Internet

Blog Widget by LinkWithin