sábado, 17 de junio de 2023

Comparación de estimaciones nacionales de la población colombiana para el período 1950-1985

 En la entrada Evaluación de las estimaciones nacionales post COVID-19 para el período 1950-2020 se comenzó el estudio de los problemas presentes en las Estimaciones vigentes del Dane, encontrando que había notables diferencias entre las estimaciones del Dane y los valores calculados en las conciliaciones demográficas de los censos levantados en el período 1950-2005.  con los valores obtenidos en el análisis de los censos colombianos.

 

En esta entrada se continúa el estudio haciendo la comparación con las estimaciones realizadas en la conciliación demográfica del censo de 1985.  

 

En el cuadro siguiente se presenta la compasión de dos juegos de estimaciones de la población nacional por sexo para el período 1950-1985, Se presenta información sobre la estimación post COVID-19 para períodos quinquenales de 1950-1985 y se contrasta con las cifras de la conciliación demográfica del censo de 1985, el primer ejercicio hecho por el Dane para un juego de estimaciones que se inician en 1950. También se presenta la diferencia porcentual entre los dos juegos de estimaciones.

 

Colombia: Estimaciones de la población masculina 1950-1985

 


 

Se puede apreciar que la población masculina tiene una diferencia porcentual promedio (12,08 %). La diferencia porcentual de la población masculina va aumentando a medida en que la retropolación avanza de 1985 hacia 1950, pasando de 1,89 % en 1985 a 24,14 % en 1950.

 

En la gráfica siguiente se puede apreciar la comparación de las estimaciones de la población masculina en el período 1950-1985. La línea magenta muestra las estimaciones vigentes mientras que la línea de puntos representa las estimaciones de la conciliación demográfica del Censo de 1985.

Estimaciones de la población masculina 1950-1985

 


En el gráfico se puede apreciar que en 1985 las dos estimaciones no coinciden siendo las estimaciones post COVID-19 280 957 personas más que las calculadas en la CD1985. Durante todo el período 1985-1950 la diferencia entre las dos estimaciones va creciendo a medida en que avanza la retropolación llegando a un máximo en 1950 de 1 432 276.  

 

Esta diferencia entre los dos juegos de estimaciones en 1950 (1 432 276) se puede descomponer en dos partes. La primera es la diferencia existente en 1985 (280 957) y la segunda 1 151 319 es la parte correspondiente al cambio demográfico entre 1950 y 1985. Las cifras anteriores muestran que la contribución del cambio demográfico es un poco más de 4 veces la correspondiente a la diferencia en la población del año base (1985).

 

Una diferencia de tal magnitud es una señal clara de que el proceso de retropolación tiene fallas grandes que se deben corregir para poder contar con un juego de estimaciones que refleje la dinámica demográfica de la población masculina en el período 1950-1985.

 

Las cifras de la población femenina se presentan en la siguiente tabla. Las nuevas estimaciones superan las estimaciones de la CD1985. La diferencia entre los dos juegos de estimación no es tan marcada como en el caso de la población masculina. Al comienzo de la retropolación en 1985 la diferencia es 259 604 y su valor va aumentando hasta llegar a 455 120 en 1965 al llegar a 1950 la diferencia entre los dos juegos de estimaciones es 192 245 un poco menos de la diferencia existente en 1985.

 

Estimaciones de la población femenina 1950-1985




 

La diferencia porcentual es mucho menor que la obtenida en la retropolación de la población masculina y además no tiene la tendencia monotónicamente creciente observada en la población masculina. A diferencia de lo observado con la población masculina. la comparación de la población femenina entre los dos juegos de estimaciones no presenta graves diferencias que indiquen serios problemas en el proceso de retropolación.

 

En el siguiente gráfico se presenta la información sobre la comparación de la población femenina para el período 1950-1985. La información de las estimaciones vigentes denominadas Post-COVID-19 se presenta en la línea magenta y los resultados de la Estimación realizadas en la CD1985 en una línea punteada.

 

Estimaciones de la población femenina 1950-1985



 

La representación gráfica confirma lo ya mencionado anteriormente. La diferencia es debida en buena parte a la población inicial de la retropolación y la contribución del cambio demográfico no es tan importante comparada con la diferencia en la población de 1985.

 

Para analizar el comportamiento diferencial por sexo es conveniente utilizar el número de hombres por cada cien mujeres conocido técnicamente como el Índice de masculinidad. Este índice tiene un comportamiento relativamente estable a través del tiempo por lo que se utiliza generalmente para detectar problemas en la coherencia temporal de los juegos de E&P.

 

En el siguiente gráfico se compara el número de hombres por cada cien mujeres para las estimaciones post COVID con los valores correspondientes a los valores obtenidos en las conciliaciones demográficas del censo de 1985.

 

En el gráfico siguiente se presentan los resultados del IM tanto para las estimaciones post COVID como las obtenidas en la CD. Según las estimaciones post COVID19 el IM para la población colombiana en 1985 fecha en la que comienza la retropolación inversa el IM de las estimaciones Post COVID (línea magenta) y el de las estimaciones CD1985 son iguales. El IM de las estimaciones post COVID a medida en que avanza la retropolación va aumentando mientras que el de la CD 1985 permanece constante. Al final de la retropolación en 1950 el IM de las estimaciones vigentes es 118.7 hombres por cada cien mujeres un valor muy alto que no es compatible con las estimaciones hechas en la CD1985 ni en el análisis demográfico del censo de 1951.

 

Colombia: Índice de Masculinidad 1950-1985



 

 

El análisis de la serie de tiempo del IM nos confirma que las estimaciones vigentes del Dane tienen un exceso de hombres como resultado en las deficiencias del cálculo de la proyección inversa a partir de los valores calculados en 1985. Además, este exceso de hombres va aumentando en términos relativos a medida en que avanza la retropolación llegando a su máximo valor en 1950.

 

Además del análisis del IM a través del tiempo también es conveniente analizar la variación del IM por edad. En Colombia en donde la migración internacional no es significativa el IM para los menores de un año es un poco menor del IM al nacer que es 105. Debido a la sobremortalidad masculina el IM va reduciéndose con la edad siempre siendo menor de cien.

 

En el gráfico siguiente se compara el IM por edades en 1985 para las estimaciones vigentes con el de las estimaciones de la CD1985. La información de las estimaciones post COVID-19 se representan con una línea magenta y las estimaciones de la CD1985 con una línea punteada, mientras que la línea punteada comienza cerca al IM al nacer (105) y va descendiendo monotónicamente la línea magenta es prácticamente horizontal.

 

Colombia Índice de masculinidad por edades 1985



 

En el gráfico también se ha incluido una línea gris correspondiente al IM de una población cerrada en donde la mortalidad ha permanecido constante y en el que el IM al nacer ha sido 105.  La discrepancia entre la línea gris y la línea magenta confirma que la retropolación de 1985 parte de una distribución por sexo en la que hay un exceso de hombres mayores de cuarenta años. La estimación de la CD1985 tiene un IM consistente con el modelo teórico.

 

El IM en 1985 muestra un mayor exceso de hombres en 1950 al fin de la proyección inversa Como se muestra en la siguiente gráfica el IM comienza a crecer con la edad a partir de un valor cercano a 105 y llega a su máximo valor (120) a los cincuenta y cinco años.

 

Colombia Índice de masculinidad por edades 1950



 

El IM de la estimación derivada de la Conciliación demográfica de 1985 (CD1985) tiene un patrón descendente con la edad. Las gráficas de los dos juegos de estimación se van separando a medida que aumenta la edad de la población. Para el grupo de edades de 75-79 años el IM de la CD 1985 es 76 mientras que el IM de las estimaciones post COVID19 es de 120. El gráfico pone en evidencia que el exceso de hombres en 1950 aumenta con la edad.

 

En el gráfico también se ha incluido la línea gris correspondiente al IM de una población cerrada en donde la mortalidad ha permanecido constante y en el que el IM al nacer ha sido 105.  La discrepancia entre la línea gris y la línea magenta confirma que la retropolación de 1985 a 1950 no es consistente con el modelo teórico (línea gris) mientras que la estimación de la CD1985 si tiene un IM consistente con el modelo teórico.

 

El exceso de hombres en la estimación post COVID en 1950 se aprecia mejor en la comparación entre esta y la gráfica del IM teórico. Se puede ver que la línea magenta para todas las edades es creciente mientras que la línea gris es decreciente y que esta diferencia entre las dos líneas se va ampliando con la edad.

 

A manera de conclusiones, vale la pena mencionar algunos de los hallazgos de la comparación entre los dos juegos de estimaciones. La estimación de la población masculina tiene serias deficiencias, lo que se traduce en un exceso de hombres en todas las edades y que va creciendo a medida en que se avanza con la retropolación desde 1985 a 1950.

 

Al descomponer las diferencias entre los dos juegos de proyecciones se ha podido establecer que para la población masculina la contribución del cambio demográfico supera la contribución de la diferencia observada en el año de 1985.

 

La utilización del Índice de masculinidad permite analizar este desbalance entre los sexos que se observa en las estimaciones vigentes del Dane. Se puede apreciar que el exceso de hombres va aumentando con la edad y el IM llega a valores muy altos comparados con el modelo teórico.

jueves, 1 de junio de 2023

Evaluación de las estimaciones nacionales post COVID-19 para el período 1950-2020

En la entrada “La actualización de las proyecciones de la población colombiana” publicada el 19 de abril de 2023 se analizaron las diferencias entre la actualización del juego de  Estimaciones[1] y Proyecciones (E&P) de la población nacional de Colombia durante el período 1950 y 2070 y las E&P calculadas en la conciliación demográfica del Censo Nacional de Población y Vivienda de 2018 CNPV2018.  Debido a que en los dos juegos o conjuntos de proyecciones del Dane sólo se introdujeron cambios en el período 2019-2070 no se realizó un análisis de las E&P del periodo 1950-2019. En esta entrada se hará una comparación de las E&P del Dane para el período 1950-2005 con los valores obtenidos en el análisis de loso censos colombianos. En una próxima entrada se hará la comparación con las E&P realizadas previamente por el Dane y se identificarán algunas inconsistencias que se observan en la información oficial vigente.

 

El 18 de mayo de 2020 el Dane publicó el primer juego de estimaciones y proyecciones de población Nacional, Municipal y Departamental. Las estimaciones vigentes para el período 1950-2020 se realizaron como parte del análisis demográfico del Censo Nacional de Población y Vivienda de 2018. El trabajo demográfico realizado por el Dane se hizo con programas que estiman la población por años simples de edad y sexo para cada uno de los años del período de la estimación. Para el CNPV el Dane obtuvo, las estimaciones para un departamento sumando las estimaciones para cabeceras y para Centros Poblados y Rural disperso (CP&RD) para así obtener las E&P departamentales. La proyección nacional se obtuvo sumando las proyecciones departamentales. Para el período 1950-1985 no se calcularon las estimaciones departamentales sino únicamente las estimaciones nacionales por edad, sexo y área geográfica.

Las estimaciones realizadas por el Dane toman como su punto de referencia el cálculo de la población nacional por área geográfica estimada para mediados de 2018 y calcula el resto de la serie por un procedimiento de retropolación o proyección inversa. Es decir, obtiene la población de 2017 a partir de la estimación de la población colombiana en 2018 restando los componentes del cambio demográfico para cada una de las cohortes que fueron estimadas en el CNPV2018. Este procedimiento de proyección inversa se repite para calcular la población de 2016, 2015 hasta llegar a 2005 año en que se levantó el Censo General.  El resultado obtenido para 2005 por el procedimiento de proyección inversa es diferente al obtenido en la conciliación demográfica del Censo General por lo que las estimaciones anteriores pierden su validez.

 

De la misma manera se procedió calculando la proyección inversa para el período 2005-1993 obteniendo los valores actualizados de las E&P. A continuación se calcularon los valores para el período 1993-1985 mediante el procedimiento de la proyección inversa. Finalmente, se realizó el proceso de proyección inversa a nivel nacional por área geográfica para el período 1985-1950.

 

El proceso seguido por el Dane tiene un gran atractivo desde el punto de vista teórico pues minimiza la utilización de procedimientos matemáticos inherentes en la desagregación de un total en sus diferentes áreas menores. Sin embargo, la información requerida no siempre está disponible ni es de la calidad suficiente para asegurar una precisión adecuada. Por ejemplo, requiere información sobre la mortalidad, fecundidad y migración para cada área geográfica de todos los departamentos.

 

Las estimaciones del Dane Post-Covid se han hecho para todos los años entre 1950 y 2023 por lo tanto es muy fácil contrastar las estimaciones para los años censales con valores que se han hecho en el momento en que se hizo el análisis demográfico de los censos colombianos. En el cuadro siguiente se aprecia la estimación del Dane y algunos valores de referencia resultado de estimaciones de la población ajustada hechas por varios investigadores y por el Dane, así como las diferencias porcentuales con relación al valor de la diferencia en donde un valor positivo indica que el valor estimado es mayor tasas de crecimiento intercensal.

 

Para 1951 y para 1964 se ha tomado el valor obtenido por Jorge Arévalo un demógrafo del Celade que hizo el análisis demográfico del censo de 1964[2]. Para 1973 el valor estimado por el DNP[3], para 1985, 1993 y 2005 los datos estimados en la conciliación del Censo General 2005 y para 2018 el valor estimado por el Dane a partir de la encuesta de cobertura.

 

Comparación entre las estimaciones de la población post COVID y valores de referencia 1951-2018


 


 

La tabla muestra claramente que en el período 1951 -1985 la diferencia relativa va disminuyendo con el tiempo. La mayor diferencia relativo ocurre en 1951 es casi un 15% que corresponde a una diferencia de un millón ochocientos mil personas. La diferencia relativa se va reduciendo y en 1964 es un poco menos de nueve por ciento que equivale a un millón seiscientos mil personas y para el censo de 1973 la diferencia es casi igual a la observada en el período anterior con un millón 611 mil personas que equivale al 7.12 %. La estimación del Dane basada en el CNPV2018 para 1985 su diferencia es de es un 1,2% menos de la calculada en el Censo General 2005 y su valor es  375 mil personas menos de la estimación realizada en la conciliación demográfica del censo de 2005. Finalmente, debe anotarse que el Dane tomó como base para la conciliación demográfica la población estimada por la encuesta de cobertura por lo tanto en 2018 no hay diferencia entre la cifra de referencia y la cifra de la conciliación demográfica es cero.  

 

La población calculada por la conciliación demográfica del CNPV2018 para 1993 y 2005 es menor a la calculada anteriormente en el CG2005. En 1993 la diferencia es de un millón 176 mil y en 2005 es un millón 217 mil. La diferencia relativa en 1993 es 3,2 % y en 2005 de 2,8%

 

La diferencia entre la estimación post COVID-19 y los referentes se aprecia más fácilmente en el siguiente gráfico

La población colombiana 1951-2018

 

              


 

Se puede determinar en el gráfico que la estimación del Dane es más alta que el valor de los referentes en el período 1951-1985 y tal como se puso de presente anteriormente se aprecia la mayor brecha entre las dos líneas al comienzo del período y prácticamente una coincidencia para 1985.

 

Para el período 1985-2018 las estimaciones del Dane son más bajas que el valor de los referentes. La mayor diferencia ocurre entre los censos de 1993 y 2005.  Sin embargo, las nuevas estimaciones no parecen estar muy alejadas de los refrentes utilizados.

 

Tratando de precisar el origen de las diferencias entre las nuevas estimaciones del Dane y los valores de referencia se consideró conveniente analizar las diferencias para las poblaciones masculina y la femenina.

 

En el cuadro siguiente aparecen los resultados de este ejercicio.

 

 

Comparación entre las estimaciones de la población por sexo post Covid y valores de referencia 1951-2018

 



 

La mayor diferencia porcentual corresponde a la población masculina. El promedio de las diferencias relativas en valor absoluto para la población masculina es de 7,8 % mientras que es de 3,49 % para la población femenina. La diferencia porcentual de la población masculina muestra una clara tendencia a irse reduciendo con el tiempo en el período 1950- 1985 mientras que la diferencia porcentual de la población femenina no tiene esa tendencia.

 

La diferencia porcentual de la población masculina para el censo de 1951 es ligeramente superior al 25 por ciento cifra que de ser verdadera implicaría una omisión censal fuera de todas proporciones pues las cifras de referencia ya tienen incorporada una omisión de 8,55 %

 

Lo mismo puede decirse de las cifras para los años censales de 1964 y 1973 pues la omisión total de los censos de 1964 y 1973 implícitos en los valores de las estimaciones post COVID-19 están fuera de totos los cálculos hechos previamente.

 

Las cifras de la población femenina son más cercanas a los valores de referencia, pero de todas maneras parecen elevadas considerando las omisiones implícitas de los censos de 1951 a 1973.

 

Los gráficos correspondientes, presentados a continuación , corroboran el análisis anterior. Una gran discrepancia en el período 1950-1985 para la población masculina y una mejor aproximación en el período 1985 -2018.

 

Colombia, Estimaciones de la población masculina 1950-2018

 



 

 

Con base en estas consideraciones es posible concluir que las estimaciones de la población masculina hechas por el Dane para los años censales son bastante alejadas de los valores de referencia en especial en el período 1950-1985.

 

Como se muestra en la siguiente gráfica, la población femenina se aproxima a los valores de referencia para los diferentes años censales. Sin embargo, los valores correspondientes a las E&P post COVID-19 son más altos que los valores de referencia lo que indica que los parámetros utilizados en la retropolación de 1985-1950 requerirían una revisión para que las estimaciones post COVID sean más cercana a la verdadera dinámica poblacional de Colombia.

Colombia, Estimaciones de la población femenina 1950-2018

 

 

 



 

Saber que hay serias inconsistencias en los niveles y composición por sexo de la población nacional del período 1950-2020 es apenas el comienzo de la evaluación de las nuevas estimaciones del Dane. Si los niveles de la población y su distribución por sexo no son los adecuados, entonces los componentes del cambio demográfico es decir el número de nacimientos, defunciones y migraciones no estarán bien calculados. Las tasas de crecimiento de las poblaciones masculina y femenina, en especial la primera de ellas tendrá graves errores debido a las discrepancias en los años censales.

 

Con el fin de poder presentar una alternativa más adecuada de la población verdadera de Colombia en el período 1950-2020, en una próxima entrada se hará la comparación de las E&P actuales con los ejercicios realizados en las conciliaciones demográficas de 1985 y 2005.  También se harán comparaciones de las estimaciones del Dane con otras fuentes como las de las Naciones Unidas y la Oficina de Censos de los Estados Unidos (USCBD por sus siglas en inglés) con el fin de tener suficientes elementos de juicios que permitan precisar la dinámica demográfica colombiana del período 1950-2020.

 

Algunas conclusiones preliminares del análisis realizado:

1.       Las estimaciones del Dane 1950-2020 tienen serias deficiencias. Por una parte, los niveles de la población calculados por el Dane son superiores a valores estimados para los años censales.

2.       Hay un exceso de hombres en las estimaciones del Dane que va reduciéndose a medida que pasa el tiempo.

3.       La comparación de las estimaciones de la conciliación demográfica del Dane basada en el CNPV2018 con las cifras ajustadas de los censos muestra que existen importantes diferencias que ameritan una reestimación de la población colombiana en el período 1950-2020.

4.       Los parámetros demográficos de la población masculina resultan inconsistentes con la dinámica demográfica colombiana en el período 1950-1985 y deben ser objeto de una revisión detallada.



[1] Técnicamente se habla de estimaciones de población cuando los cálculos ser refieren a lo ocurrido antes de la fecha actual y proyecciones cuando se refiere a cálculos sobre la población de un período posterior a la fecha actual. Por convención la población se calcula a mitad del año.

[2] Arévalo, J. (1968). AJUSTE DEL CENSO DE POBIACION DE COLOMBIA DE 1964. Santiago de Chile: Celade.

[3] Rueda, J. O., Manrique de Llinás, H., & Vergara, V. (1982). DINÁMICA DEMOGRÁFICA Y PROYECCIONES DE POBLACIÓN DEL PAÍS, LOS TERRITORIOS NACIONALES, BOGOTÁ, LOS DEPARTAMENTOS Y LAS 30 PRINCIPALES CIUDADES: ASPECTOS METODOLÓGICOS Y PRINCIPALES RESULTADOS. Revista de Planeación y Desarrollo, XIV(3), 9-52. Obtenido de https://colaboracion.dnp.gov.co/CDT/RevistaPD/1982/pd_vXIV_n3_1982_art.1.pdf