martes, 14 de julio de 2020

Evaluación de un juego de proyecciones de población: Análisis demográfico para no demógrafos Parte II

En la entrada anterior comenzamos la evaluación de un juego de proyecciones y para ello hicimos tres gráficos en los  que se compararon los resultados con un referente. Mostramos en primer lugar un gráfico en el que aparecía la población total de Colombia, otro en el que comparamos la población urbana de los dos juegos de proyecciones y un tercero en el que se hacía una comparación entre las proyecciones de la población rural.

Concluimos que la diferencia entre los dos juegos se debía a diferencias en la proyección de la población rural. Para poder terminar la evaluación era necesario evaluar el tercer gráfico desde el punto de vista demográfico.

Los que han trabajado con proyecciones de población rural para Colombia se sorprenderían mucho de que el número absoluto de habitantes en la zona rural crezca de manera continuada por un período de 65 años entre 2005 y 2070.

En 2005 cuando trabajaba en el Censo General 2005 y tuve que revisar juegos de proyecciones de población rural me acordé de los escritos del profesor Lauchlin Currie y en especial de su propuesta de la Operación Colombia[1] que se basaba en una revisión histórica del desarrollo  económico de los Estados Unidos y me pareció que dado el estado de desarrollo de Colombia en 2005 se estaría entrando en una fase en la que el número absoluto de habitantes de la parte rural permanecería constante por un tiempo para luego descender.

Esta hipótesis es muy fácil de incorporar en el análisis gráfico pues lo único que se requiere es trazar una recta horizontal que pase por el nivel de la población al inicio del período. En el siguiente gráfico se incorpora la idea de una población rural estacionaria mediante una linea de color gris. Si la hipótesis de que la población se mantiene por debajo del nivel inicial esta línea gris señalaría un techo para las proyecciones de la población rural colombiana.  

Dicho de otra manera una proyección por encima de la línea gris daría una señal de alerta que debería ser investigada de inmediato.

Al introducir esta línea gris (ver gráfico siguiente) en nuestro análisis se pone en evidencia que el juego de proyecciones relativos a la proyección A no está de acuerdo con el posible desarrollo económico colombiano.

 





Por el contrario la línea naranja está de acuerdo con la hipótesis derivada del trabajo del Profesor Currie, pues al comienzo está cerca al techo indicado en la línea gris y  luego a partir del año 2020 comienza a descender..

Basado en este comportamiento de la proyección con relación al techo fijado, podemos concluir que la línea azul no refleja la posible trayectoria de la población colombiana hasta el año 2070 mientras que la línea naranja muestra una trayectoria por debajo del techo pero que podría tener un descenso muy rápido a partir de 2020.

En un trabajo reciente revisé la información demográfica del Censo Nacional Agropecuario levantado en 2014 y me sorprendió que la población del rural disperso era muy inferior a la observada en el Censo General 2005 lo que haría que el valor estimado para 2014 en la línea azul no fuera consistente con nuestra realidad demográfica.

Por otra parte, el porcentaje urbano es decir la participación de las cabeceras  municipales en el total del país en la mayoría de las proyecciones es creciente por tanto un gráfico de esta proporción con relación al tiempo ayudaría mucho a dilucidar la validez de nuestra línea azul.

A través del tiempo se ha podido observar que la proporción urbana ha aumentado como consecuencia de un crecimiento más rápido de la población urbana que la población rural. Esta observación ha dado lugar a una metodología denominada diferenciales del crecimiento desarrollada inicialmente por las Naciones Unidas, por lo que ahora se conoce entre los demógrafos como el método de las Naciones Unidas. Bajo la hipótesis de un diferencial constante el porcentaje urbano tiene una trayectoria logística muy similar a las observadas en epidemiología.

Para introducir en la comparación un porcentaje urbano correspondiente a la línea gris tomaremos como población urbana la calculada en la proyección A y obtendremos el total como la suma de esta población rural estacionaria y la población rural de nuestro juego de proyecciones designado con la letra A.

Los resultados de este ejercicio se presentan en el gráfico siguiente.

Cómo se aprecia en el gráfico la línea azul está siempre por debajo de la línea gris correspondiente a nuestro modelo de población rural estacionaria. No tiene una forma logística y tiende a mantenerse constante lo que significa que los sectores urbano rural crecen a tasas similares lo que va en contra de la evidencia observada en el mundo.

La línea naranja si se comporta de acuerdo a modelo de los diferenciales del crecimiento y parece seguir una trayectoria logística. Se puede apreciar que la línea naranja está siempre por encima de la línea gris como es de esperar pues la hipótesis de una población rural estacionaria define un piso para el porcentaje de la población urbana. 

Basados en el gráfico anterior podemos decir que la proyección A está por debajo del piso establecido por nuestra línea gris mientras que la línea naranja está por encima del piso establecido por la hipótesis de la población rural estacionaria. 

Hasta el momento hemos concentrado nuestro análisis en dos proyecciones sobre Colombia por lo que antes de dar el veredicto me puse a mirar proyecciones de otros países similares a Colombia.

El CELADE trae ejemplos de proyecciones de largo plazo para los países de nuestra región decidí bajar las proyecciones de los diez países de la Conmebol para analizar el comportamiento demográfico futuro.

En líneas generales  observé una población rural decreciente y un porcentaje urbano creciente lo que me reafirmo que las proyecciones representadas en nuestro ejercicio por la línea azul tienen serias deficiencias que requerirían un ajuste urgente.

Por considerar que el caso del Perú era representativo de la situación en otros países de la región y teniendo en cuenta las similitudes con nuestro caso colombiano presentaré a continuación un gráfico de la población rural de dicho país

En el gráfico se puede apreciar que la población proyectada es decreciente a partir de 2020.


Este comportamiento de la población rural proyectada para el Perú nos da un argumento más  en contra de las proyecciones que hemos rotulado como A porque no describen adecuadamente la evolución futura de Colombia y en especial de la población rural.

El lector que ha seguido nuestra discusión es probable que hace mucho tiempo descubrió que el juego de proyecciones que hemos venido denotando con la letra A fueron elaboradas por el Dane como parte del trabajo posterior al CNPV 2018.

Los especialistas en demografía probablemente también han adivinado que las proyecciones que se han representado con la línea naranja corresponden a las elaboradas por las Naciones Unidas y que se pueden descargar del sitio de internet del Celade.

Sorprende, eso sí que el Dane no haya hecho un ejercicio parecido al que se ha presentado en estas dos entradas del Blog que hubiera hecho sonar las alarmas y evitado la publicación de unas proyecciones con serios problemas.

Más sorprendente aún es que las dificultades se hayan originado en un cambio metodológico introducido en la elaboración de las proyecciones. A diferencia de la metodología utilizada por Naciones Unidas de comenzar con una proyección nacional para después obtener la población urbana por el método de los diferenciales del crecimiento.

El Dane adoptó una metodología definida de manera críptica así:”

“Tipo de proyección: determinística con desagregación geográfica a nivel total nacional por área (bottom-up) consistente con la división político administrativa del país. Así mismo, para cabeceras, centros poblados y rural disperso; total departamental y municipal se sigue un esquema top-down. Para la elaboración de las proyecciones, se contó con el aplicativo RUP RUPAGG desarrollado por U. S. Census Bureau.”

Si la comunidad demográfica hubiera entendido bien que el Dane estaba planeando se hubiera  se hubiera declarado una alerta naranja porque el procedimiento descrito anunciaba un desastre inminente tal como ocurrió, pues se estaba construyendo un edificio con bases muy débiles en la parte rural.

Por otra parte ignorar información demográfica en algunos departamentos con buenos registros de nacimientos y defunciones no es adecuado pues con el software utilizado por el Dane es posible hacer las proyecciones departamentales muy rápidamente y luego obtener el total nacional por la suma de las proyecciones departamentales mediante el RUPAGG..

Más aún, con la liberación de nuevo software por la Oficina de Censos se cuenta con programas apropiados que ni siquiera necesitan tener una licencia de Office para poder hacer proyecciones de población.

Cuando comenzaba mi carrera de consultor uno de mis jefes me enseño que un trabajo de consultoría siempre debería tener una sección que se llamara conclusiones y recomendaciones y que cada recomendación se debía basar en una conclusión soportada en el trabajo de consultoría También era superfluo llegar a una conclusión que no diera lugar a una recomendación pues la consultoría a diferencia de la investigación debe ser orientada a cosas prácticas que se puedan llevar a cabo.

Siguiendo ese sabio consejo de la existencia de una relación biunívoca entre conclusiones y recomendaciones voy a terminar mi análisis con una conclusión y su correspondiente recomendación

 .

CONCLUSIÓN

RECOMENDACIÓN

Las proyecciones realizadas por el Dane no son apropiadas para la formulación de políticas públicas

La Dirección de Demografía del Departamento Administrativo Nacional de Estadística debe producir un nuevo juego de proyecciones

 Añadido el 15 de julio de 2020

 A solicitud de algunos lectores del Blog he incluido unos gráficos en los que se muestran las fuentes y los datos que sirvieron de base para el análisis presentado



Muy pronto pondré a disposición de los interesados un documento técnico sobre las proyecciones. 



[1] El 10 de noviembre de 2014 escribí una entrada en el Blog  en el que repasé las ideas de Currie relacionadas con el tema. Esta entrada se puede consultar en el siguiente enlace. https://alvaropachon.blogspot.com/2014/11/lauchlin-currie-ya-lo-habia-dicho.html


lunes, 13 de julio de 2020

Evaluación de un juego de proyecciones de población: Análisis demográfico para no demógrafos Parte I


En mi actividad profesional muchas veces he tenido que revisar unos juegos de proyecciones de población para establecer su validez. En esas ocasiones he utilizado un tratamiento propio de la demografía y he notado que la audiencia tiende a perder interés en el tema muy pronto. En esta entrada presento un enfoque basado en gráficos que han puesto de moda los epidemiólogos aficionados.  

Como en la propaganda de los detergentes en la televisión voy a presentar la información sin que el lector pueda identificar fácilmente el fabricante del producto. Para esto voy a identificar un juego de proyecciones con el rótulo Proy A  y el otro juego como Proy B.

He considerado que para no revelar fácilmente los autores de las proyecciones no es conveniente colocar en los gráficos las cifras de las proyecciones sino que es mejor trabajar con cifras relativas al año base. Voy a tomar como base cien el valor de la proyección A en 2005  y voy a analizar solamente el nivel de la población total del país y sus componentes urbanos y rurales.

He preparado seis gráficos para hacer mi exposición. El primero es una comparación de las dos proyecciones a nivel nacional. El segundo presenta las proyecciones para las cabeceras municipales que por facilidad hablaré de proyecciones urbanas. El tercero presenta las proyecciones de los Centros Poblados y Rural Disperso que  denominaré resto o rural.

Una vez presentados estos tres gráficos en una segunda entrada que publicaré muy pronto presentaré en un cuarto gráfico un modelo muy sencillo sobre la evolución de la población rural en un país como Colombia.  Este gráfico nos permitirá valorar las dos alternativas presentadas. En el quinto gráfico se mostrarán los resultados de los dos juegos de proyecciones en lo que se refiere al porcentaje urbano o sea la participación de las cabeceras municipales sobre el total del país. El sexto gráfico traerá un gráfico de la población rural de un país suramericano similar a Colombia.

El análisis de los dos juegos de proyecciones comienza con  las cifras correspondientes al total del país. A lo largo del trabajo la proyección A se presenta con el color azul y la proyección B se presenta con el color naranja.


A simple vista se aprecia que en lo que corresponde a un momento anterior a hoy, es decir el trece de julio de 2010, las dos cifras son parecidas[1]. A partir de la fecha es decir lo que corresponde propiamente a una proyección las dos cifras divergen. Se ve claramente que la proyección A es mayor que la proyección B y que tiene su máximo en una fecha posterior al momento en que la Proyección  B tiene su máximo.

Para los que entienden mejor un tema con números me he permitido preparar una tabla con algunos años seleccionados.


En la tabla anterior se debe tener presente que se ha tomado como base cien la estimación de la población de 2005 para la proyección A.

Como se puede apreciar en la tabla para 2005 y para 2020 la población es prácticamente la misma. Para 2050 la diferencia ha llegado a superar en 14,4 a la proyección B. Al final del período la diferencia entre las dos proyecciones es 21,96.

Se ha señalado en verde el valor máximo de la proyección. Según la tabla, la proyección B llega a su máximo en 2064 y la proyección B lo hace 14 años antes en 2050.

Los resultados presentados nos dan una señal de alarma pues a priori uno podía pensar que las dos proyecciones deberían ser muy parecidas y la discrepancia no debería ser tan grande.

Una vez descubierta una gran discrepancia entre los dos juegos de proyecciones para la población total es conveniente mirar por aparte las proyecciones del sector urbano y las del sector rural

En el siguiente gráfico se presentan los resultados de esta comparación para el sector urbano.  Debe recalcarse que la base cien corresponde a la población el 30 de junio de 2005 para el juego de proyecciones A.



La línea azul está por debajo de la línea naranja y a simple vista parece que a partir de 2020 las curvas son paralelas.

Para precisar el comportamiento de las dos proyecciones se ha hecho una comparación de los resultados de las dos proyecciones. Los resultados aparecen la siguiente tabla.

Se puede ver que para 2005 la diferencia es de 1,17 y de ahí en adelante la diferencia es de un poco más de cinco por ciento de la población base en el año 2005.

 

La comparación entre las cifras correspondientes a los dos juegos de proyecciones confirma lo dicho con base en el análisis del gráfico. En la tabla también se observa que el máximo de la población que se ha resaltado en color verde ocurre en 2059 para la proyección A y en 2058 para la proyección B.

El análisis está mostrando cierta congruencia entre los dos juegos en lo que respecta a la parte urbana. Sin embargo, como el signo de la diferencia es el opuesto al observado en el total nacional nos da una indicación de que el análisis de las proyecciones del sector rural mostrará una divergencia muy grande entre los dos juegos de proyecciones,

Lo dicho anteriormente se comprueba cuando una mira el gráfico correspondiente a la población rural en los dos juegos de proyecciones.  


Las proyecciones que hemos rotulado con la letra A son siempre crecientes mientras que las que se han rotulado con la letra B decrecen permanentemente. Al final del período la línea azul llega a  38,51 mientras que las proyecciones representadas por la línea naranja se han reducido a 11,38, Menos de una tercera parte de la proyección B.

La tabla siguiente muestra las cifras para algunos años seleccionados.


 

El máximo de la población rural ocurre al final del período para la proyección A, mientras que el máximo ocurre al comienzo del período para la proyección B.

Del análisis anterior se puede concluir que la discrepancia entre las proyecciones nacionales se explica principalmente por las diferencias en el componente rural y que por lo tanto es necesario contar con la asistencia de un demógrafo que nos explique cuál de las dos proyecciones explican mejor el comportamiento del sector rural.

Para dilucidar entonces es necesario hacer una consulta a un demógrafo para que nos ayude a dar el veredicto sobre cuál de los dos tiene deficiencias.

En la próxima entrada del Blog, que espero publicar mañana, me pondré mi gorro de demógrafo para dar un veredicto sobre el tema...



[1] Técnicamente a las cifras correspondientes a la fecha de hoy y anteriores se les denomina estimaciones y las que corresponden a una fecha posterior se les da el término de proyecciones. Como las cifras sobre el nivel de población están referidas a la mitad del período hoy en día las cifras de población relativas a 2020 son estimaciones y no proyecciones.


martes, 21 de abril de 2020

La información demográfica nos ayuda a entender mejor los efectos de la pandemia en Bogotá.



Suba Usaquén y Kennedy las localidades con el mayor número de casos no son las más golpeadas por la pandemia. Chapinero, Teusaquillo y La Candelaria ocupan los tres primeros lugares.

Con el paso del tiempo se ha puesto de presente que en tiempos de pandemias  considerar únicamente el número de pacientes infectados es insuficiente cuando se quiere hacer comparaciones entre diferentes unidades  geográficas.

Para hacer cotejos entre países se ha vuelto rutina tener en cuenta el tamaño de la población y establecer la prevalencia del Corona virus. Para poder entender bien la discusión técnica de la evolución de la pandemia transcribo la definición que trae la Rae en su Diccionario de la Lengua Española. “En epidemiología, proporción de personas que sufren una enfermedad con respecto al total de la población en estudio.”

sábado, 25 de enero de 2020

Colombia ya tiene cincuenta millones de habitantes




El 14 de octubre de 2019 el Dane publicó la estimación de la población de los municipios colombianos ajustada por omisión para mediados de 2018. Ciento dos días después, el 24 de enero de 2020, la institución puso a disposición del público la estimación de la población municipal a 30 de junio de 2019 y la proyección para mediados del presente año. A partir de esta fecha las proyecciones elaboradas con base en el Censo General 2005 perdieron su vigencia y las cifras oficiales para Colombia para los tres últimos años son las que aparecen en los cuadros liberados por el Dane el 24 de enero de 2020.

Como se había previsto la población de Colombia a mediados de 2018 resultó inferior a la cifra de 49.834.240 calculada por el Dane hace más de 10 años. La nueva cifra oficial publicada por el Dane fue 48.258.494. Esto quiere decir que la proyección de la población a finales de junio de 2018 tenía una sobreestimación de 1.575.746 personas. Para mediados del año 2020 la nueva proyección del Dane es de 50.372.424 habitantes, Como referente es conveniente mencionar que el Dane había proyectado que para mediados de 2020 habría 50.911.747. Es decir, una diferencia de 539.323 habitantes.

El World Factbook publicado por la Agencia Central de Inteligencia de los Estados Unidos contiene información sobre los diferentes países. En lo referente a Colombia tiene una proyección para mediados del año de 49.084.841 un poco inferior a la nueva cifra oficial. 

Según la publicación mencionada anteriormente Colombia ocupa el puesto 30 en el mundo por su población. El puesto 29 corresponde a España con una cifra para mediados de 2020 de 50.015.792 habitantes. Con las nuevas proyecciones Colombia superaría a España y pasaría a ocupar el puesto 29 entre los países más poblados del Mundo.

Pero no solo es noticia nuestro avance en el escalafón poblacional, sino que a mediados del año vamos a estar en el Club de los treinta países que tienen más de cincuenta millones de habitantes. Para saber si en este momento somos ya pertenecemos a este club se me hizo lógico actualizar mi reloj de población que he venido ajustando a medida que el Dane produce más información sobre el CNPV2018. Al introducir la información en mi reloj encontré que todavía no habíamos llegado pero que pronto el 12 de febrero llegaríamos a esa mágica cifra.

Lo interesante de esta información publicada por el Dane es que estamos cerca a los cincuenta millones de habitantes que el Dane había previsto para el 20 de octubre de 2018 a las 9:52 de la mañana. Esto quiere decir que el reloj del Dane se adelantó 480 días en anunciar la llegada a los cincuenta millones de habitantes. Es decir, un año, tres meses y veintitrés días.

Al actualizar el reloj de la población me pareció interesante ampliar el alcance del reloj y comencé con un ejercicio para Bogotá. Me di cuenta de que sería conveniente ir más allá y decidí entonces Hacer el cálculo de la población para todos los departamentos.  En esta entrada incluyó el reloj departamental para el beneficio de mis lectores.