sábado, 17 de junio de 2023

Comparación de estimaciones nacionales de la población colombiana para el período 1950-1985

 En la entrada Evaluación de las estimaciones nacionales post COVID-19 para el período 1950-2020 se comenzó el estudio de los problemas presentes en las Estimaciones vigentes del Dane, encontrando que había notables diferencias entre las estimaciones del Dane y los valores calculados en las conciliaciones demográficas de los censos levantados en el período 1950-2005.  con los valores obtenidos en el análisis de los censos colombianos.

 

En esta entrada se continúa el estudio haciendo la comparación con las estimaciones realizadas en la conciliación demográfica del censo de 1985.  

 

En el cuadro siguiente se presenta la compasión de dos juegos de estimaciones de la población nacional por sexo para el período 1950-1985, Se presenta información sobre la estimación post COVID-19 para períodos quinquenales de 1950-1985 y se contrasta con las cifras de la conciliación demográfica del censo de 1985, el primer ejercicio hecho por el Dane para un juego de estimaciones que se inician en 1950. También se presenta la diferencia porcentual entre los dos juegos de estimaciones.

 

Colombia: Estimaciones de la población masculina 1950-1985

 


 

Se puede apreciar que la población masculina tiene una diferencia porcentual promedio (12,08 %). La diferencia porcentual de la población masculina va aumentando a medida en que la retropolación avanza de 1985 hacia 1950, pasando de 1,89 % en 1985 a 24,14 % en 1950.

 

En la gráfica siguiente se puede apreciar la comparación de las estimaciones de la población masculina en el período 1950-1985. La línea magenta muestra las estimaciones vigentes mientras que la línea de puntos representa las estimaciones de la conciliación demográfica del Censo de 1985.

Estimaciones de la población masculina 1950-1985

 


En el gráfico se puede apreciar que en 1985 las dos estimaciones no coinciden siendo las estimaciones post COVID-19 280 957 personas más que las calculadas en la CD1985. Durante todo el período 1985-1950 la diferencia entre las dos estimaciones va creciendo a medida en que avanza la retropolación llegando a un máximo en 1950 de 1 432 276.  

 

Esta diferencia entre los dos juegos de estimaciones en 1950 (1 432 276) se puede descomponer en dos partes. La primera es la diferencia existente en 1985 (280 957) y la segunda 1 151 319 es la parte correspondiente al cambio demográfico entre 1950 y 1985. Las cifras anteriores muestran que la contribución del cambio demográfico es un poco más de 4 veces la correspondiente a la diferencia en la población del año base (1985).

 

Una diferencia de tal magnitud es una señal clara de que el proceso de retropolación tiene fallas grandes que se deben corregir para poder contar con un juego de estimaciones que refleje la dinámica demográfica de la población masculina en el período 1950-1985.

 

Las cifras de la población femenina se presentan en la siguiente tabla. Las nuevas estimaciones superan las estimaciones de la CD1985. La diferencia entre los dos juegos de estimación no es tan marcada como en el caso de la población masculina. Al comienzo de la retropolación en 1985 la diferencia es 259 604 y su valor va aumentando hasta llegar a 455 120 en 1965 al llegar a 1950 la diferencia entre los dos juegos de estimaciones es 192 245 un poco menos de la diferencia existente en 1985.

 

Estimaciones de la población femenina 1950-1985




 

La diferencia porcentual es mucho menor que la obtenida en la retropolación de la población masculina y además no tiene la tendencia monotónicamente creciente observada en la población masculina. A diferencia de lo observado con la población masculina. la comparación de la población femenina entre los dos juegos de estimaciones no presenta graves diferencias que indiquen serios problemas en el proceso de retropolación.

 

En el siguiente gráfico se presenta la información sobre la comparación de la población femenina para el período 1950-1985. La información de las estimaciones vigentes denominadas Post-COVID-19 se presenta en la línea magenta y los resultados de la Estimación realizadas en la CD1985 en una línea punteada.

 

Estimaciones de la población femenina 1950-1985



 

La representación gráfica confirma lo ya mencionado anteriormente. La diferencia es debida en buena parte a la población inicial de la retropolación y la contribución del cambio demográfico no es tan importante comparada con la diferencia en la población de 1985.

 

Para analizar el comportamiento diferencial por sexo es conveniente utilizar el número de hombres por cada cien mujeres conocido técnicamente como el Índice de masculinidad. Este índice tiene un comportamiento relativamente estable a través del tiempo por lo que se utiliza generalmente para detectar problemas en la coherencia temporal de los juegos de E&P.

 

En el siguiente gráfico se compara el número de hombres por cada cien mujeres para las estimaciones post COVID con los valores correspondientes a los valores obtenidos en las conciliaciones demográficas del censo de 1985.

 

En el gráfico siguiente se presentan los resultados del IM tanto para las estimaciones post COVID como las obtenidas en la CD. Según las estimaciones post COVID19 el IM para la población colombiana en 1985 fecha en la que comienza la retropolación inversa el IM de las estimaciones Post COVID (línea magenta) y el de las estimaciones CD1985 son iguales. El IM de las estimaciones post COVID a medida en que avanza la retropolación va aumentando mientras que el de la CD 1985 permanece constante. Al final de la retropolación en 1950 el IM de las estimaciones vigentes es 118.7 hombres por cada cien mujeres un valor muy alto que no es compatible con las estimaciones hechas en la CD1985 ni en el análisis demográfico del censo de 1951.

 

Colombia: Índice de Masculinidad 1950-1985



 

 

El análisis de la serie de tiempo del IM nos confirma que las estimaciones vigentes del Dane tienen un exceso de hombres como resultado en las deficiencias del cálculo de la proyección inversa a partir de los valores calculados en 1985. Además, este exceso de hombres va aumentando en términos relativos a medida en que avanza la retropolación llegando a su máximo valor en 1950.

 

Además del análisis del IM a través del tiempo también es conveniente analizar la variación del IM por edad. En Colombia en donde la migración internacional no es significativa el IM para los menores de un año es un poco menor del IM al nacer que es 105. Debido a la sobremortalidad masculina el IM va reduciéndose con la edad siempre siendo menor de cien.

 

En el gráfico siguiente se compara el IM por edades en 1985 para las estimaciones vigentes con el de las estimaciones de la CD1985. La información de las estimaciones post COVID-19 se representan con una línea magenta y las estimaciones de la CD1985 con una línea punteada, mientras que la línea punteada comienza cerca al IM al nacer (105) y va descendiendo monotónicamente la línea magenta es prácticamente horizontal.

 

Colombia Índice de masculinidad por edades 1985



 

En el gráfico también se ha incluido una línea gris correspondiente al IM de una población cerrada en donde la mortalidad ha permanecido constante y en el que el IM al nacer ha sido 105.  La discrepancia entre la línea gris y la línea magenta confirma que la retropolación de 1985 parte de una distribución por sexo en la que hay un exceso de hombres mayores de cuarenta años. La estimación de la CD1985 tiene un IM consistente con el modelo teórico.

 

El IM en 1985 muestra un mayor exceso de hombres en 1950 al fin de la proyección inversa Como se muestra en la siguiente gráfica el IM comienza a crecer con la edad a partir de un valor cercano a 105 y llega a su máximo valor (120) a los cincuenta y cinco años.

 

Colombia Índice de masculinidad por edades 1950



 

El IM de la estimación derivada de la Conciliación demográfica de 1985 (CD1985) tiene un patrón descendente con la edad. Las gráficas de los dos juegos de estimación se van separando a medida que aumenta la edad de la población. Para el grupo de edades de 75-79 años el IM de la CD 1985 es 76 mientras que el IM de las estimaciones post COVID19 es de 120. El gráfico pone en evidencia que el exceso de hombres en 1950 aumenta con la edad.

 

En el gráfico también se ha incluido la línea gris correspondiente al IM de una población cerrada en donde la mortalidad ha permanecido constante y en el que el IM al nacer ha sido 105.  La discrepancia entre la línea gris y la línea magenta confirma que la retropolación de 1985 a 1950 no es consistente con el modelo teórico (línea gris) mientras que la estimación de la CD1985 si tiene un IM consistente con el modelo teórico.

 

El exceso de hombres en la estimación post COVID en 1950 se aprecia mejor en la comparación entre esta y la gráfica del IM teórico. Se puede ver que la línea magenta para todas las edades es creciente mientras que la línea gris es decreciente y que esta diferencia entre las dos líneas se va ampliando con la edad.

 

A manera de conclusiones, vale la pena mencionar algunos de los hallazgos de la comparación entre los dos juegos de estimaciones. La estimación de la población masculina tiene serias deficiencias, lo que se traduce en un exceso de hombres en todas las edades y que va creciendo a medida en que se avanza con la retropolación desde 1985 a 1950.

 

Al descomponer las diferencias entre los dos juegos de proyecciones se ha podido establecer que para la población masculina la contribución del cambio demográfico supera la contribución de la diferencia observada en el año de 1985.

 

La utilización del Índice de masculinidad permite analizar este desbalance entre los sexos que se observa en las estimaciones vigentes del Dane. Se puede apreciar que el exceso de hombres va aumentando con la edad y el IM llega a valores muy altos comparados con el modelo teórico.

jueves, 1 de junio de 2023

Evaluación de las estimaciones nacionales post COVID-19 para el período 1950-2020

En la entrada “La actualización de las proyecciones de la población colombiana” publicada el 19 de abril de 2023 se analizaron las diferencias entre la actualización del juego de  Estimaciones[1] y Proyecciones (E&P) de la población nacional de Colombia durante el período 1950 y 2070 y las E&P calculadas en la conciliación demográfica del Censo Nacional de Población y Vivienda de 2018 CNPV2018.  Debido a que en los dos juegos o conjuntos de proyecciones del Dane sólo se introdujeron cambios en el período 2019-2070 no se realizó un análisis de las E&P del periodo 1950-2019. En esta entrada se hará una comparación de las E&P del Dane para el período 1950-2005 con los valores obtenidos en el análisis de loso censos colombianos. En una próxima entrada se hará la comparación con las E&P realizadas previamente por el Dane y se identificarán algunas inconsistencias que se observan en la información oficial vigente.

 

El 18 de mayo de 2020 el Dane publicó el primer juego de estimaciones y proyecciones de población Nacional, Municipal y Departamental. Las estimaciones vigentes para el período 1950-2020 se realizaron como parte del análisis demográfico del Censo Nacional de Población y Vivienda de 2018. El trabajo demográfico realizado por el Dane se hizo con programas que estiman la población por años simples de edad y sexo para cada uno de los años del período de la estimación. Para el CNPV el Dane obtuvo, las estimaciones para un departamento sumando las estimaciones para cabeceras y para Centros Poblados y Rural disperso (CP&RD) para así obtener las E&P departamentales. La proyección nacional se obtuvo sumando las proyecciones departamentales. Para el período 1950-1985 no se calcularon las estimaciones departamentales sino únicamente las estimaciones nacionales por edad, sexo y área geográfica.

Las estimaciones realizadas por el Dane toman como su punto de referencia el cálculo de la población nacional por área geográfica estimada para mediados de 2018 y calcula el resto de la serie por un procedimiento de retropolación o proyección inversa. Es decir, obtiene la población de 2017 a partir de la estimación de la población colombiana en 2018 restando los componentes del cambio demográfico para cada una de las cohortes que fueron estimadas en el CNPV2018. Este procedimiento de proyección inversa se repite para calcular la población de 2016, 2015 hasta llegar a 2005 año en que se levantó el Censo General.  El resultado obtenido para 2005 por el procedimiento de proyección inversa es diferente al obtenido en la conciliación demográfica del Censo General por lo que las estimaciones anteriores pierden su validez.

 

De la misma manera se procedió calculando la proyección inversa para el período 2005-1993 obteniendo los valores actualizados de las E&P. A continuación se calcularon los valores para el período 1993-1985 mediante el procedimiento de la proyección inversa. Finalmente, se realizó el proceso de proyección inversa a nivel nacional por área geográfica para el período 1985-1950.

 

El proceso seguido por el Dane tiene un gran atractivo desde el punto de vista teórico pues minimiza la utilización de procedimientos matemáticos inherentes en la desagregación de un total en sus diferentes áreas menores. Sin embargo, la información requerida no siempre está disponible ni es de la calidad suficiente para asegurar una precisión adecuada. Por ejemplo, requiere información sobre la mortalidad, fecundidad y migración para cada área geográfica de todos los departamentos.

 

Las estimaciones del Dane Post-Covid se han hecho para todos los años entre 1950 y 2023 por lo tanto es muy fácil contrastar las estimaciones para los años censales con valores que se han hecho en el momento en que se hizo el análisis demográfico de los censos colombianos. En el cuadro siguiente se aprecia la estimación del Dane y algunos valores de referencia resultado de estimaciones de la población ajustada hechas por varios investigadores y por el Dane, así como las diferencias porcentuales con relación al valor de la diferencia en donde un valor positivo indica que el valor estimado es mayor tasas de crecimiento intercensal.

 

Para 1951 y para 1964 se ha tomado el valor obtenido por Jorge Arévalo un demógrafo del Celade que hizo el análisis demográfico del censo de 1964[2]. Para 1973 el valor estimado por el DNP[3], para 1985, 1993 y 2005 los datos estimados en la conciliación del Censo General 2005 y para 2018 el valor estimado por el Dane a partir de la encuesta de cobertura.

 

Comparación entre las estimaciones de la población post COVID y valores de referencia 1951-2018


 


 

La tabla muestra claramente que en el período 1951 -1985 la diferencia relativa va disminuyendo con el tiempo. La mayor diferencia relativo ocurre en 1951 es casi un 15% que corresponde a una diferencia de un millón ochocientos mil personas. La diferencia relativa se va reduciendo y en 1964 es un poco menos de nueve por ciento que equivale a un millón seiscientos mil personas y para el censo de 1973 la diferencia es casi igual a la observada en el período anterior con un millón 611 mil personas que equivale al 7.12 %. La estimación del Dane basada en el CNPV2018 para 1985 su diferencia es de es un 1,2% menos de la calculada en el Censo General 2005 y su valor es  375 mil personas menos de la estimación realizada en la conciliación demográfica del censo de 2005. Finalmente, debe anotarse que el Dane tomó como base para la conciliación demográfica la población estimada por la encuesta de cobertura por lo tanto en 2018 no hay diferencia entre la cifra de referencia y la cifra de la conciliación demográfica es cero.  

 

La población calculada por la conciliación demográfica del CNPV2018 para 1993 y 2005 es menor a la calculada anteriormente en el CG2005. En 1993 la diferencia es de un millón 176 mil y en 2005 es un millón 217 mil. La diferencia relativa en 1993 es 3,2 % y en 2005 de 2,8%

 

La diferencia entre la estimación post COVID-19 y los referentes se aprecia más fácilmente en el siguiente gráfico

La población colombiana 1951-2018

 

              


 

Se puede determinar en el gráfico que la estimación del Dane es más alta que el valor de los referentes en el período 1951-1985 y tal como se puso de presente anteriormente se aprecia la mayor brecha entre las dos líneas al comienzo del período y prácticamente una coincidencia para 1985.

 

Para el período 1985-2018 las estimaciones del Dane son más bajas que el valor de los referentes. La mayor diferencia ocurre entre los censos de 1993 y 2005.  Sin embargo, las nuevas estimaciones no parecen estar muy alejadas de los refrentes utilizados.

 

Tratando de precisar el origen de las diferencias entre las nuevas estimaciones del Dane y los valores de referencia se consideró conveniente analizar las diferencias para las poblaciones masculina y la femenina.

 

En el cuadro siguiente aparecen los resultados de este ejercicio.

 

 

Comparación entre las estimaciones de la población por sexo post Covid y valores de referencia 1951-2018

 



 

La mayor diferencia porcentual corresponde a la población masculina. El promedio de las diferencias relativas en valor absoluto para la población masculina es de 7,8 % mientras que es de 3,49 % para la población femenina. La diferencia porcentual de la población masculina muestra una clara tendencia a irse reduciendo con el tiempo en el período 1950- 1985 mientras que la diferencia porcentual de la población femenina no tiene esa tendencia.

 

La diferencia porcentual de la población masculina para el censo de 1951 es ligeramente superior al 25 por ciento cifra que de ser verdadera implicaría una omisión censal fuera de todas proporciones pues las cifras de referencia ya tienen incorporada una omisión de 8,55 %

 

Lo mismo puede decirse de las cifras para los años censales de 1964 y 1973 pues la omisión total de los censos de 1964 y 1973 implícitos en los valores de las estimaciones post COVID-19 están fuera de totos los cálculos hechos previamente.

 

Las cifras de la población femenina son más cercanas a los valores de referencia, pero de todas maneras parecen elevadas considerando las omisiones implícitas de los censos de 1951 a 1973.

 

Los gráficos correspondientes, presentados a continuación , corroboran el análisis anterior. Una gran discrepancia en el período 1950-1985 para la población masculina y una mejor aproximación en el período 1985 -2018.

 

Colombia, Estimaciones de la población masculina 1950-2018

 



 

 

Con base en estas consideraciones es posible concluir que las estimaciones de la población masculina hechas por el Dane para los años censales son bastante alejadas de los valores de referencia en especial en el período 1950-1985.

 

Como se muestra en la siguiente gráfica, la población femenina se aproxima a los valores de referencia para los diferentes años censales. Sin embargo, los valores correspondientes a las E&P post COVID-19 son más altos que los valores de referencia lo que indica que los parámetros utilizados en la retropolación de 1985-1950 requerirían una revisión para que las estimaciones post COVID sean más cercana a la verdadera dinámica poblacional de Colombia.

Colombia, Estimaciones de la población femenina 1950-2018

 

 

 



 

Saber que hay serias inconsistencias en los niveles y composición por sexo de la población nacional del período 1950-2020 es apenas el comienzo de la evaluación de las nuevas estimaciones del Dane. Si los niveles de la población y su distribución por sexo no son los adecuados, entonces los componentes del cambio demográfico es decir el número de nacimientos, defunciones y migraciones no estarán bien calculados. Las tasas de crecimiento de las poblaciones masculina y femenina, en especial la primera de ellas tendrá graves errores debido a las discrepancias en los años censales.

 

Con el fin de poder presentar una alternativa más adecuada de la población verdadera de Colombia en el período 1950-2020, en una próxima entrada se hará la comparación de las E&P actuales con los ejercicios realizados en las conciliaciones demográficas de 1985 y 2005.  También se harán comparaciones de las estimaciones del Dane con otras fuentes como las de las Naciones Unidas y la Oficina de Censos de los Estados Unidos (USCBD por sus siglas en inglés) con el fin de tener suficientes elementos de juicios que permitan precisar la dinámica demográfica colombiana del período 1950-2020.

 

Algunas conclusiones preliminares del análisis realizado:

1.       Las estimaciones del Dane 1950-2020 tienen serias deficiencias. Por una parte, los niveles de la población calculados por el Dane son superiores a valores estimados para los años censales.

2.       Hay un exceso de hombres en las estimaciones del Dane que va reduciéndose a medida que pasa el tiempo.

3.       La comparación de las estimaciones de la conciliación demográfica del Dane basada en el CNPV2018 con las cifras ajustadas de los censos muestra que existen importantes diferencias que ameritan una reestimación de la población colombiana en el período 1950-2020.

4.       Los parámetros demográficos de la población masculina resultan inconsistentes con la dinámica demográfica colombiana en el período 1950-1985 y deben ser objeto de una revisión detallada.



[1] Técnicamente se habla de estimaciones de población cuando los cálculos ser refieren a lo ocurrido antes de la fecha actual y proyecciones cuando se refiere a cálculos sobre la población de un período posterior a la fecha actual. Por convención la población se calcula a mitad del año.

[2] Arévalo, J. (1968). AJUSTE DEL CENSO DE POBIACION DE COLOMBIA DE 1964. Santiago de Chile: Celade.

[3] Rueda, J. O., Manrique de Llinás, H., & Vergara, V. (1982). DINÁMICA DEMOGRÁFICA Y PROYECCIONES DE POBLACIÓN DEL PAÍS, LOS TERRITORIOS NACIONALES, BOGOTÁ, LOS DEPARTAMENTOS Y LAS 30 PRINCIPALES CIUDADES: ASPECTOS METODOLÓGICOS Y PRINCIPALES RESULTADOS. Revista de Planeación y Desarrollo, XIV(3), 9-52. Obtenido de https://colaboracion.dnp.gov.co/CDT/RevistaPD/1982/pd_vXIV_n3_1982_art.1.pdf

miércoles, 19 de abril de 2023

La actualización de las proyecciones de la población colombiana

 El 21 de marzo de 2023 el Departamento Administrativo Nacional de Estadística (Dane) actualizó su conjunto de estimaciones y proyecciones basado en el Censo Nacional de Población y Vivienda de 2018 (CNPV2018).

Es una gran noticia para el país que el Dane ofrezca una información actualizada y que por primera vez en su historia haya reconocido la importancia de ajustar sus proyecciones teniendo en cuenta las variaciones que afectan los componentes del cambio demográfico (nacimientos, defunciones y migraciones). El COVID-19 y la continuación de la migración venezolana han sido eventos que no se habían tenido en cuenta cuando se hicieron las proyecciones iniciales y que ameritaban una revisión cuidadosa de las proyecciones vigentes para poder incorporar estos cambios en la dinámica demográfica colombiana.

 

Esta actualización es muy oportuna por dos razones principales. La primera estamos en vísperas de las elecciones regionales y las estimaciones y proyecciones[1] de los departamentos y municipios van a ser de gran utilidad a los alcaldes y gobernadores que serán elegidos el 29 de octubre de 2023. Además, en este momento se están discutiendo reformas trascendentales como la pensional, la de la salud y la laboral para las que unas proyecciones actualizadas a nivel nacional son  fundamentales para poder analizar las consecuencias de estas reformas en el largo plazo.

 

Al igual que las proyecciones  iniciales el  nuevo conjunto de estimaciones y proyecciones del Dane, trae unas proyecciones nacionales por años simples de edad y por área geográfica[2] para todos los años del período 2018-2070, unas proyecciones departamentales por área geográfica, por años simples de edad y para todos los años del período 2018-2050 y unas proyecciones municipales por área geográfica, años simples de edad,  para todos los años del período 2018-2035.

 

Para destacar el efecto del COVID-19, el Dane denomina el conjunto de proyecciones iniciales como Pre COVID-19 y el conjunto actualizado de las proyecciones como Post COVID-19.  En una nota al pie del gráfico en el que muestran los resultados del ejercicio el Dane escribe: “El crecimiento observado en el año 2018 responde al incremento de la inmigración. El distanciamiento de la serie pre COVID-19 y  post COVID-19 responde al exceso de mortalidad entre los años 2020-2021”.

 

En la presentación de los resultados el Dane ha incluido como elemento de comparación los resultados recientes de la ONU o sea la versión 2022 del World Population Prospects en la que por primera vez se hacen las estimaciones y proyecciones por años simples de edad para cada año calendario.

 

A continuación se presentará un análisis comparativo de las dos proyecciones del Dane para el período 2018-2070 pues las estimaciones del período 1950-2017 no tuvieron cambios. El análisis de la comparación entre el nuevo conjunto de proyecciones y los resultados de WPP se hará en una próxima entrada.  

 

En el siguiente Gráfico se presentan los resultados para la población colombiana. Las dos versiones del Dane parten de la población corregida por omisión censal y mala declaración de edad (48,258,494) del Censo Nacional de Población y Vivienda 2018 CNPV2018.  La proyección post-COVID-19 a partir de 2020 presenta valores inferiores a los de la proyección pre-COVID-19.

 

Colombia: Estimaciones y proyecciones de población nacional 2018-2070

 



 

La diferencia entre las dos  proyecciones del Dane va creciendo a medida que pasa el tiempo. Al final del período de análisis (2070) el Dane proyecta una población de 55,4 millones, un  12 % menos que los 63,0 millones de la proyección anterior.

 

En las nuevas proyecciones del Dane, el máximo de la población de Colombia ocurriría en 2051 con una población de 57,7 millones de personas. En las proyecciones anteriores el máximo se  estimaba que ocurriría en 2064 y su valor sería 63,2 millones.

 

Las tasas de crecimiento de las proyecciones del Dane son diferentes en especial a partir de 2020 cuando las dos curvas del gráfico comienzan a separarse. En el siguiente gráfico se presentan las tasas de crecimiento de los dos conjuntos de estimaciones y proyecciones del Dane así como la diferencia entre las tasas de crecimiento.

 

Colombia: Tasa anual de crecimiento de población nacional (%) 2018-2070


 

Siguiendo las convenciones utilizadas en la presentación de los resultados, las cifras pre COVID-19 se representa con una línea punteada y el conjunto Post Covid-19 con una línea magenta. Se ha incluido una línea azul que representa la diferencia entre las tasas de crecimiento de los dos conjuntos de estimaciones y proyecciones del Dane. Se ha utilizado una escala diferente (eje derecho) para poder apreciar mejor las diferencias entre las dos tasas de crecimiento.

 

En 2018  las tasas de crecimiento de los dos conjuntos de estimaciones del Dane son iguales. De 2019 a 2023 la tasa de crecimiento post COVID-19 es mayor que la pre COVID-19. En este período el COVID-19 y su consecuente aumento en la mortalidad  afectaron negativamente la tasa de crecimiento de la población colombiana, mientras que la inmigración venezolana tuvo un efecto positivo en la tasa de crecimiento de la población. Como el resultado final fue un incremento en la tasa de crecimiento de la población el efecto del aumento de la migración venezolana fue mayor que el efecto negativo del COVID-19.

 

A partir de 2023 las nuevas proyecciones tienen una tasa de crecimiento menor que las de preCOVID-19. La mayor diferencia entre las tasas de crecimiento de los dos conjuntos de proyecciones (línea azul) ocurre  en 2028.

 

Para poder analizar en mayor detalle las diferencias entre las tasas de los dos conjuntos de proyecciones del Dane es conveniente analizar primero el efecto del crecimiento natural o sea, la diferencia entre las tasas brutas de natalidad y las tasas brutas de mortalidad. En el gráfico se presentan los resultados de la tasa de crecimiento natural. Al igual que en el gráfico anterior se ha añadido una línea correspondiente a la diferencia entre los dos conjuntos de estimaciones y proyecciones del Dane

 

Colombia: tasa de crecimiento natural 2018-2070  TCN x mil hab.


 

 


 

Desde 2019 a 2029 la tasa de crecimiento natural del nuevo conjunto de proyecciones del Dane es menor que la que se había calculado anteriormente. Este es el efecto del COVID-19 y de la manera como se ajustarán las tasas de natalidad y mortalidad para volver a la tendencia de largo plazo que se supone llegue a su tendencia anterior en 2029. De 2030 a 2064 la tasa de crecimiento natural del nuevo conjunto es ligeramente superior. En los  seis últimos años la tasa del nuevo conjunto es ligeramente inferior a la del conjunto inicial.

 

El efecto de los cambios en los supuestos de la migración internacional se puede apreciar en el gráfico siguiente.

 

Colombia: Tasa Migración Internacional Neta 2018-2070 TNM x mil hab.

 



 

El gráfico muestra que en el segundo conjunto de proyecciones hay un descenso más lento de la tasa de migración venezolana y, por otra parte, un cambio importante de largo plazo pues en el primer conjunto de proyecciones se consideraba que Colombia tendría un flujo de inmigrantes mientras que en el segundo juego se considera que Colombia volvería en 2029 a su condición habitual de un exceso de emigrantes sobre los inmigrantes.

 

Una diferencia importante entre los dos conjuntos de proyecciones es que la desagregación por área geográfica es decir entre cabeceras, por un lado, y centros poblados y rural disperso por el otro, solo se presenta hasta 2035. De ahí en adelante únicamente se presenta el agregado del total nacional o departamental. Pienso que esa decisión es correcta pues el análisis del conjunto de proyecciones iniciales mostraba que la información no era compatible con otras estimaciones, ni con las tendencias observada en otros países similares a Colombia.

 

Del análisis presentado en esta entrada del Blog se podrían sacar algunas conclusiones.

1.       Cambiar las proyecciones de población cuando ha aparecido nueva información que no se había contemplado en el cálculo inicial es un paso adelante ya que los interesados en el tema de la población cuentan con cifras más confiables. Esta actualización se convertirá en un insumo básico para el análisis del efecto de las reformas que se están estudiando en el Congreso y para los gobernadores y alcaldes que se elegirán el  29 de octubre de 2023

2.       El Dane ha incorporado cambios en los supuestos de población más acordes con la dinámica demográfica. Los niveles de población calculados en la actualización de las proyecciones de población lucen más acertados.

3.       El cambio en los supuestos de migración explicaría en buena parte la disminución de los niveles de población así como la reducción en las tasas del crecimiento de la población.

4.       Dada las dificultades metodológicas del proceso de proyección por área utilizado en el primer conjunto de proyecciones resulta encomiable que el Dane haya dejado de desagregar por área a partir de 2035.

 

 



[1] Una estimación se refiere a una población que tiene una fecha igual o anterior a la fecha actual y una proyección es la que se refiere a una fecha posterior a la actual.

[2] Cuando se habla de proyecciones por área geográfica se quiere decir que se presenta la población para dos categorías: i) cabecera y ii) centros poblados y rural disperso. En el nuevo conjunto de proyecciones no existe una desagregación por área geográfica a partir de 2035 y sólo se presenta información para el total nacional o departamental..

martes, 14 de julio de 2020

Evaluación de un juego de proyecciones de población: Análisis demográfico para no demógrafos Parte II

En la entrada anterior comenzamos la evaluación de un juego de proyecciones y para ello hicimos tres gráficos en los  que se compararon los resultados con un referente. Mostramos en primer lugar un gráfico en el que aparecía la población total de Colombia, otro en el que comparamos la población urbana de los dos juegos de proyecciones y un tercero en el que se hacía una comparación entre las proyecciones de la población rural.

Concluimos que la diferencia entre los dos juegos se debía a diferencias en la proyección de la población rural. Para poder terminar la evaluación era necesario evaluar el tercer gráfico desde el punto de vista demográfico.

Los que han trabajado con proyecciones de población rural para Colombia se sorprenderían mucho de que el número absoluto de habitantes en la zona rural crezca de manera continuada por un período de 65 años entre 2005 y 2070.

En 2005 cuando trabajaba en el Censo General 2005 y tuve que revisar juegos de proyecciones de población rural me acordé de los escritos del profesor Lauchlin Currie y en especial de su propuesta de la Operación Colombia[1] que se basaba en una revisión histórica del desarrollo  económico de los Estados Unidos y me pareció que dado el estado de desarrollo de Colombia en 2005 se estaría entrando en una fase en la que el número absoluto de habitantes de la parte rural permanecería constante por un tiempo para luego descender.

Esta hipótesis es muy fácil de incorporar en el análisis gráfico pues lo único que se requiere es trazar una recta horizontal que pase por el nivel de la población al inicio del período. En el siguiente gráfico se incorpora la idea de una población rural estacionaria mediante una linea de color gris. Si la hipótesis de que la población se mantiene por debajo del nivel inicial esta línea gris señalaría un techo para las proyecciones de la población rural colombiana.  

Dicho de otra manera una proyección por encima de la línea gris daría una señal de alerta que debería ser investigada de inmediato.

Al introducir esta línea gris (ver gráfico siguiente) en nuestro análisis se pone en evidencia que el juego de proyecciones relativos a la proyección A no está de acuerdo con el posible desarrollo económico colombiano.

 





Por el contrario la línea naranja está de acuerdo con la hipótesis derivada del trabajo del Profesor Currie, pues al comienzo está cerca al techo indicado en la línea gris y  luego a partir del año 2020 comienza a descender..

Basado en este comportamiento de la proyección con relación al techo fijado, podemos concluir que la línea azul no refleja la posible trayectoria de la población colombiana hasta el año 2070 mientras que la línea naranja muestra una trayectoria por debajo del techo pero que podría tener un descenso muy rápido a partir de 2020.

En un trabajo reciente revisé la información demográfica del Censo Nacional Agropecuario levantado en 2014 y me sorprendió que la población del rural disperso era muy inferior a la observada en el Censo General 2005 lo que haría que el valor estimado para 2014 en la línea azul no fuera consistente con nuestra realidad demográfica.

Por otra parte, el porcentaje urbano es decir la participación de las cabeceras  municipales en el total del país en la mayoría de las proyecciones es creciente por tanto un gráfico de esta proporción con relación al tiempo ayudaría mucho a dilucidar la validez de nuestra línea azul.

A través del tiempo se ha podido observar que la proporción urbana ha aumentado como consecuencia de un crecimiento más rápido de la población urbana que la población rural. Esta observación ha dado lugar a una metodología denominada diferenciales del crecimiento desarrollada inicialmente por las Naciones Unidas, por lo que ahora se conoce entre los demógrafos como el método de las Naciones Unidas. Bajo la hipótesis de un diferencial constante el porcentaje urbano tiene una trayectoria logística muy similar a las observadas en epidemiología.

Para introducir en la comparación un porcentaje urbano correspondiente a la línea gris tomaremos como población urbana la calculada en la proyección A y obtendremos el total como la suma de esta población rural estacionaria y la población rural de nuestro juego de proyecciones designado con la letra A.

Los resultados de este ejercicio se presentan en el gráfico siguiente.

Cómo se aprecia en el gráfico la línea azul está siempre por debajo de la línea gris correspondiente a nuestro modelo de población rural estacionaria. No tiene una forma logística y tiende a mantenerse constante lo que significa que los sectores urbano rural crecen a tasas similares lo que va en contra de la evidencia observada en el mundo.

La línea naranja si se comporta de acuerdo a modelo de los diferenciales del crecimiento y parece seguir una trayectoria logística. Se puede apreciar que la línea naranja está siempre por encima de la línea gris como es de esperar pues la hipótesis de una población rural estacionaria define un piso para el porcentaje de la población urbana. 

Basados en el gráfico anterior podemos decir que la proyección A está por debajo del piso establecido por nuestra línea gris mientras que la línea naranja está por encima del piso establecido por la hipótesis de la población rural estacionaria. 

Hasta el momento hemos concentrado nuestro análisis en dos proyecciones sobre Colombia por lo que antes de dar el veredicto me puse a mirar proyecciones de otros países similares a Colombia.

El CELADE trae ejemplos de proyecciones de largo plazo para los países de nuestra región decidí bajar las proyecciones de los diez países de la Conmebol para analizar el comportamiento demográfico futuro.

En líneas generales  observé una población rural decreciente y un porcentaje urbano creciente lo que me reafirmo que las proyecciones representadas en nuestro ejercicio por la línea azul tienen serias deficiencias que requerirían un ajuste urgente.

Por considerar que el caso del Perú era representativo de la situación en otros países de la región y teniendo en cuenta las similitudes con nuestro caso colombiano presentaré a continuación un gráfico de la población rural de dicho país

En el gráfico se puede apreciar que la población proyectada es decreciente a partir de 2020.


Este comportamiento de la población rural proyectada para el Perú nos da un argumento más  en contra de las proyecciones que hemos rotulado como A porque no describen adecuadamente la evolución futura de Colombia y en especial de la población rural.

El lector que ha seguido nuestra discusión es probable que hace mucho tiempo descubrió que el juego de proyecciones que hemos venido denotando con la letra A fueron elaboradas por el Dane como parte del trabajo posterior al CNPV 2018.

Los especialistas en demografía probablemente también han adivinado que las proyecciones que se han representado con la línea naranja corresponden a las elaboradas por las Naciones Unidas y que se pueden descargar del sitio de internet del Celade.

Sorprende, eso sí que el Dane no haya hecho un ejercicio parecido al que se ha presentado en estas dos entradas del Blog que hubiera hecho sonar las alarmas y evitado la publicación de unas proyecciones con serios problemas.

Más sorprendente aún es que las dificultades se hayan originado en un cambio metodológico introducido en la elaboración de las proyecciones. A diferencia de la metodología utilizada por Naciones Unidas de comenzar con una proyección nacional para después obtener la población urbana por el método de los diferenciales del crecimiento.

El Dane adoptó una metodología definida de manera críptica así:”

“Tipo de proyección: determinística con desagregación geográfica a nivel total nacional por área (bottom-up) consistente con la división político administrativa del país. Así mismo, para cabeceras, centros poblados y rural disperso; total departamental y municipal se sigue un esquema top-down. Para la elaboración de las proyecciones, se contó con el aplicativo RUP RUPAGG desarrollado por U. S. Census Bureau.”

Si la comunidad demográfica hubiera entendido bien que el Dane estaba planeando se hubiera  se hubiera declarado una alerta naranja porque el procedimiento descrito anunciaba un desastre inminente tal como ocurrió, pues se estaba construyendo un edificio con bases muy débiles en la parte rural.

Por otra parte ignorar información demográfica en algunos departamentos con buenos registros de nacimientos y defunciones no es adecuado pues con el software utilizado por el Dane es posible hacer las proyecciones departamentales muy rápidamente y luego obtener el total nacional por la suma de las proyecciones departamentales mediante el RUPAGG..

Más aún, con la liberación de nuevo software por la Oficina de Censos se cuenta con programas apropiados que ni siquiera necesitan tener una licencia de Office para poder hacer proyecciones de población.

Cuando comenzaba mi carrera de consultor uno de mis jefes me enseño que un trabajo de consultoría siempre debería tener una sección que se llamara conclusiones y recomendaciones y que cada recomendación se debía basar en una conclusión soportada en el trabajo de consultoría También era superfluo llegar a una conclusión que no diera lugar a una recomendación pues la consultoría a diferencia de la investigación debe ser orientada a cosas prácticas que se puedan llevar a cabo.

Siguiendo ese sabio consejo de la existencia de una relación biunívoca entre conclusiones y recomendaciones voy a terminar mi análisis con una conclusión y su correspondiente recomendación

 .

CONCLUSIÓN

RECOMENDACIÓN

Las proyecciones realizadas por el Dane no son apropiadas para la formulación de políticas públicas

La Dirección de Demografía del Departamento Administrativo Nacional de Estadística debe producir un nuevo juego de proyecciones

 Añadido el 15 de julio de 2020

 A solicitud de algunos lectores del Blog he incluido unos gráficos en los que se muestran las fuentes y los datos que sirvieron de base para el análisis presentado



Muy pronto pondré a disposición de los interesados un documento técnico sobre las proyecciones. 



[1] El 10 de noviembre de 2014 escribí una entrada en el Blog  en el que repasé las ideas de Currie relacionadas con el tema. Esta entrada se puede consultar en el siguiente enlace. https://alvaropachon.blogspot.com/2014/11/lauchlin-currie-ya-lo-habia-dicho.html