martes, 21 de abril de 2020

La información demográfica nos ayuda a entender mejor los efectos de la pandemia en Bogotá.



Suba Usaquén y Kennedy las localidades con el mayor número de casos no son las más golpeadas por la pandemia. Chapinero, Teusaquillo y La Candelaria ocupan los tres primeros lugares.

Con el paso del tiempo se ha puesto de presente que en tiempos de pandemias  considerar únicamente el número de pacientes infectados es insuficiente cuando se quiere hacer comparaciones entre diferentes unidades  geográficas.

Para hacer cotejos entre países se ha vuelto rutina tener en cuenta el tamaño de la población y establecer la prevalencia del Corona virus. Para poder entender bien la discusión técnica de la evolución de la pandemia transcribo la definición que trae la Rae en su Diccionario de la Lengua Española. “En epidemiología, proporción de personas que sufren una enfermedad con respecto al total de la población en estudio.”


Para calcular este indicador es necesario conocer el número de personas que sufren la enfermedad y el total de la población en estudio. Los medios de comunicación traen a diario la evolución del número de personas que sufren la enfermedad  y con el paso del tiempo han surgido sitios web que presentan la información correspondiente y que se actualizan permanentemente.

Por otra parte, la información demográfica para los diferentes países es menos visible y requiere una cierta habilidad para encontrarla. Los practicantes de la demografía aplicada conocen bien las principales fuentes de información sobre la población mundial. Para algunas de mis columnas he utilizado información de la Oficina de Censos de los Estados Unidos y de la División de Población de las Naciones Unidas. El Population Reference Bureau recopila información sobre el tema poblacional y a veces es una fuente alterna interesante.

En el receso de semana santa estuvimos trabajando con unos colegas por medio de vídeo llamadas y utilizamos el Office 365 que trae un nuevo tipo de manejo de datos que facilitaba mucho hacer comparaciones entre países, departamentos o provincias y en algunos casos, sobretodo en los Estados Unidos a nivel de Código Postal.
Como la población es una de las variables que se pueden obtener de manera sencilla cuando uno utiliza el nuevo formato de datos espaciales de Excel, el trabajo de obtener el denominador ara el cálculo de la prevalencia del Corona Virus pra in país pues ya no es necesario consultar una página y transcribir el dato de la página de internet a la hoja de cálculo en que uno está trabajando. .

Para poder hacer análisis en el segundo nivel jerárquico de un país el problema es un poco más difícil. En primer lugar la información sobre las personas que sufren una enfermedad es más escasa y no tiene la misma calidad y se ha producido con rezago.

Afortunadamente, en el caso colombiano el Instituto Nacional de Salud está publicando información sobre la evolución de epidemia en Colombia a nivel municipal. Gracias al trabajo del Dane hoy se cuenta con unas proyecciones de población para junio de 2020 que se pueden tomar como el  total de la población en estudio en cada uno de los municipios colombianos.

Como se dijo anteriormente, hacer las tablas que muestren la evolución de la pandemia a nivel de los países, departamentos y municipios se ha vuelto más sencillo sobre todo con las nuevas estructuras de datos de Escel introducidas en las últimas versiones de Office 365.

Otro problema al que se ven enfrentados los analistas del Corona Virus en Colombia es hacer una presentación de estos datos que permitan determinar la incidencia espacial de la enfermedad. Los mapas que aparecen en los sitios de internet especializados en el tema, son muy ilustrativos pero por lo general no son apropiados para muchos casos de interés.

Si se cuenta con recursos suficientes y en el equipo hay un experto en información geográfico con el que se haya tenido una experiencia por largo tiempo. es posible trabajar eficientemente en el despliegue de información geográfica.

En las teleconferencias de semana santa en las que trabajamos con las nuevas estructuras de datos nos dimos cuenta que las últimas versiones de Office 365 ahora permitían hacer mapas temáticos tanto en 2 como en tres dimensiones y que incluso permitían incorporar la cartografía del Dane a nivel desagregado.

Gracias a las discusiones con los colegas durante la semana santa logramos aprender a utilizar los mapas en Excel para hacer análisis a nivel municipal y departamental. También pudimos utilizar la nueva opción de formatos de datos y los mapas de Excel para representar información sobre todos los países del mundo.

La disponibilidad de información sobre las personas que sufren del Corona Virus para las diferentes localidades de Bogotá representa un reto importante para la demografía aplicada. Si no se conoce la población para cada una de las localidades el análisis de la incidencia de la epidemia de corona virus se limitaría a darle una mirada a las cifras del número total de casos tal como lo hace un artículo del periódico El Tiempo del 20 de abril pasado.

Una información relevante que muestra la base de datos de la alcaldía de Bogotá sobre la pandemia del coronavirus es que las localidades más afectadas son Suba, Usaquén y Kennedy. Las tres tienen el mayor número de personas contagiadas: 235, 220 y 198, respectivamente. Suman 653 casos de los 1.597 confirmados en Bogotá.”[1]
El artículo se basa en la siguiente tabla.

Los que conocen a Bogotá entienden muy bien que Suba la localidad más populosa de Bogotá con una población similar a la de Barranquilla casi siempre aparecerá de primera en cualquier ranking de localidades y por lo tanto parece lógico que cuando se clasifica a las localidades por el número de afectados por la pandemia de Corona Virus, suba se gane la medalla de oro.  

Las cifras de población para Bogotá por localidades aparecen en la siguiente tabla. 


Según el reloj de la población que desarrollé con motivos de la llegada a los cincuenta millones y que se actualiza en tiempo real el 19 de abril de 2020 Bogotá tenía 7.714.383 habitantes. Utilizando unas participaciones calculadas a partir de una presentación del Director del Dane en la Sociedad de Mejoras y Ornato de Bogotá. estimé que la población de Suba era 1.206.220, que Kenendy tenía 1.0689.814 habitantes y ocupaba el segundo lugar y que la tercera localidad en términos de población era Engativá..
Usaquén que ocupaba el segundo lugar en términos de enfermos por Corona Virus.ocupaba el quinto lugar en términos de población.

De la simple comparación entre  dos tablas se puede ver que Suba y Kennedy están entre los tres mejores en las dos variables: población y casos identificados. Usaquén tiene un número mayor de casos a los que le correspondería por su tamaño y Engativá tiene una menor incidencia de la que le correspondería por su población.

Para poder aislar el efecto del tamaño es habitual calcular la prevalencia del COVID-19 es decir el número de casos por cada millón de habitantes. En la siguientes tabla se presenta la prevalencia del Corona Virus en las tres localidades con mayor número de casos. Para efectos de este cálculo se debe excluir de los 1597 casos reportados por la Secretaría de Salud de Bogotá. 20 casos que corresponden a pacientes que no residen en Bogotá y 7 personas para las cuales no se conoce su lugar de residencia. De esta manera solo se utilizan 1570 observaciones para hacer el cálculo de la prevalencia por localidades. 

El cuadro siguiente   muestra la prevalencia medida en casos por millón de habitantes.



En la tabla también se ha incluido el cálculo de la prevalencia para el total de Bogotá. Esto permite hacer un análisis mas interesante. No solo podemos establecer cuál es la localidad con mayor prevalencia, sino también  y cuál de estas localidades tiene una prevalencia mayor que la del total de Bogotá.

Como se puede ver en la tabla la prevalencia para los residentes de Bogotá es de 203,5 casos por millón de habitantes. La prevalencia del Covid-19 en Suba es de 194.8 un poco menor de la de todo Bogotá lo que quiere decir que Suba no ha sido tan golpeada como el resto de Bogotá y que simplemente el elevado número de casos se explica más bien porque  su población  es mayor que la de las otras localidades de Bogotá.

Un argumento similar aplicaría para Kennedy. Su elevado número de casos presentados obedece más al tamaño de la localidad que a la contundencia del golpe propinado por la pandemia.
Usaquén, en cambio tiene una mayor intensidad del Corona virus que la que le correspondería en términos de su población.
Los especialistas en economía regional y urbana han desarrollado una medida que indica la intensidad relativa de una variable. Esta medida es el cociente de localización (Location quotient[2]). Este indicador se obtiene dividiendo la prevalencia de la localidad por la prevalencia de la región.
En el cuadro siguiente se calcula el cociente de localización para las tres localidades  anteriores.




Los resultados de la tabla son más fáciles de interpretar.  Un cociente de localización menor que uno muestra que la intensidad es menor que la de la región en su totalidad. De las tres localidades la que realmente ha sido más golpeada es Usaquén mientras que las otras dos han tenido un elevado número de caso pero la contundencia del golpe ha sido menor que en el total de Bogotá.  

Pero antes de formular hipótesis de las razones para que en Usaquén el virus haya tenido un efecto mayor es necesario revisar las cifras de todas las localidades.
En el cuadro se puede ver la prevalencia medida en casos por millón de habitantes y el cociente de localización para las 19 localidades.


La tabla presenta una visión totalmente diferente. Los tres casos con un mayor cociente de localización son Chapinero, Teusaquillo y La Candelaria.

Estas tres zonas tienen muy buena dotación de servicios públicos las familias son pequeñas con porcentajes altos de hogares unipersonales, son respetuosos de las leyes de confinamiento. Por otra parte tienen zonas de uso mixto con una buena presencia de empleos formales e informales.

Una metodología de tratar de encontrar las características específicas de las tres zonas con mayor incidencia puede llevarnos a formular hipótesis que no resulten ciertas. Suele ser mejor mirar toda la información y mirar también las localidades que tienen los menores cocientes de localización  También es conveniente no solo mirar las cifras que aparecen en las tablas sino también analizar las interrelaciones espaciales que se presentan en la ciudad.

El mapa siguiente nos representa la distribución espacial del cociente de localización. Las zonas que tienen el mayor coeficiente tienen el color más intenso. mientras que las zonas blancas representan las localidades con el menor cociente de localización.



Sorprende encontrar como las localidades de menor intensidad son Usme y San Cristóbal y también con muy baja incidencia Ciudad Bolívar, Bosa, Rafael Uribe Uribe. Todas ellas con altas densidades y pertenecientes a estratos bajos.

Una primera visión del mapa pareciera confirmar algunas observaciones sobre el Corona Virus. Es una enfermedad de ricos y a los pobres les afecta menos. En contraste, los costos  del confinamiento afectan más a los pobres pues tienen una pérdida relativa del ingreso por la inmovilización.

Al volver a revisar el mapa me pareció encontrar que el patrón de la intensidad tenía más parecido a los patrones de densidad de empleo que a los patrones de densidad de la población.que uno intuitivamente esperaba.

Otra posible explicación de este patrón es que la verdadera prevalencia de la enfermedad no se mide con la misma precisión en los barrios populares que en los barrios más consolidados con familias que están acostumbradas a un uso intensivo de los servicios médicos.

Tres cosas me han quedado claras de esta exploración de la información del Corona Virus. En primer lugar que el Office  365 incluye una nueva gama de herramientas que facilitan el manejo de la información. La consulta sobre la información de los países es ahora muy sencilla y además permite desplegarla en Mapas que ayudan a entender los patrones geográficos de la propagación de la enfermedad.

En segundo lugar, las proyecciones del Dane para los departamentos y municipios del país permiten analizar la información que está produciendo el sector salud estableciendo las prevalencias municipales y departamentales. 

Finalmente, analizar la información  para las subdivisiones de la ciudad es más complicado pues la información tanto de las personas que sufren la enfermedad como el total de de la población para las subdivisiones de la ciudad no se conocen con la precisión requerida para hacer el cálculo de la prevalencia a ese nivel de desagregación geográfica. Más aún, poder hacer una presentación de los resultados de manera atractiva requiere utilizar herramientas más especializadas que los mapas de  Microsoft Office 365.

Nota; esta entrada se actualizó el 22 de abril teniendo en cuenta un comentario hecho por Rafael Cubillos sobre la base de datos del INS. Las tablas se cambiaron el 23 de abril para hacerlas más legibles. 

4 comentarios:

  1. Alvaro, gracias por la interpretación alternativa, en particular el uso del coeficiente de localización. En la web del INS https://www.ins.gov.co/Noticias/Paginas/Coronavirus.aspx se puede descargar los datos al día de hoy (abril 22), y los municipios traen su Divipola. El link de allí lo lleva a Datos Abiertos.

    ResponderEliminar
  2. Será que se puede correlacionar los datos de localidades con los casos importados según país? (una gran parte de España)

    ResponderEliminar
  3. Dr Pachon gracias por ilustrarnos este hecho co su generosidad académica. Pérez-Toro

    ResponderEliminar
    Respuestas
    1. Muy querido y admirado Profesor muchas gracias por leer la entrada y sobretodo por su comentario. Me encanta cuando lo veo en tan agradables entornos Oxford y clubes de golf.

      Eliminar