SciELO - Scientific Electronic Library Online

 
 número40Garantia de Privacidade Versus Utilidade dos Dados em Anonimização: um estudo no ensino superior índice de autoresíndice de assuntosPesquisa de artigos
Home Pagelista alfabética de periódicos  

Serviços Personalizados

Journal

Artigo

Indicadores

Links relacionados

  • Não possue artigos similaresSimilares em SciELO

Compartilhar


RISTI - Revista Ibérica de Sistemas e Tecnologias de Informação

versão impressa ISSN 1646-9895

RISTI  no.40 Porto dez. 2020  Epub 30-Dez-2020

https://doi.org/10.17013/risti.40.128-145 

Artigos

Previsões de mortalidade e de esperança de vida mediante combinação Bayesiana de modelos: Uma aplicação à população portuguesa

Mortality and life expectancy forecasts using Bayesian model combinations: An application to the Portuguese population

Jorge M. Bravo1  2  3 

Mercedes Ayuso4  5 

1 NOVA IMS - Universidade Nova de Lisboa Campus de Campolide, 1070-312 Lisbon, Portugal.

2Université Paris-Dauphine PSL, Paris, França

3CEFAGE-EU, Evóra, Portugal

4University of Barcelona, Department of Econometrics, Statistics and Applied Economy, Diagonal, 690 08034 Barcelona, Spain. mayuso@ub.edu

5Riskcenter-UB, Faculty of Economics and Business Barcelona, Spain


Resumo

Neste artigo desenvolve-se um modelo de previsão da mortalidade específica por idade e da esperança de vida mediante combinação Bayesiana de modelos (Bayesian Model Ensemble). O procedimento envolve a selecção do subconjunto de modelos a usar e a determinação dos respectivos ponderadores. São ainda calculados intervalos de confiança para as variáveis de interesse usando uma metodologia assente em Bayesian credible prediction intervals considerando o risco de modelo. Os modelos são calibrados à população portuguesa desagregada por sexo usando informação estatística relativa ao período 1960-2018 e às idades no intervalo 60-125. São efectuadas previsões até 2050. Os resultados obtidos antecipam a continuação do aumento da esperança de vida por período e por coorte nas idades adultas registado nas últimas décadas e sinalizam a existência nos sistemas de protecção social de impostos/subsídios implícitos entre gerações que distorcem as decisões de consumo, de mercado de trabalho e de poupança e questionam a justiça intergeracional.

Palavras-chave: Bayesian Model Ensemble; esperança de vida; modelos de previsão; modelos de mortalidade estocásticos; risco longevidade.

Abstract

In this paper we forecast age-specific mortality rates and life expectancy measures using an adaptive Bayesian Model Ensemble of heterogeneous models. The procedure involves both the selection of the model confidence set and the determination of optimal weights. Model-averaged Bayesian credible prediction intervals are derived accounting for both the uncertainty arising from model error and parameter uncertainty. The models are calibrated to Portuguese population data in the period 1960-2018 and age range 60-125 and forecasted to 2050. The results anticipate a continuous increase in both period and cohort life expectancy at adult ages and signal significant implicit taxes and subsidies between generations, which distort consumption, saving and investment decisions and challenge intergenerational fairness.

Keywords: Bayesian Model Ensemble; life expectancy; forecasting methods; stochastic mortality models; longevity risk.

1. Introdução

A evolução da longevidade humana nos países desenvolvidos nas últimas décadas é marcada por um aumento notável da esperança de vida em todas as idades, fruto da redução das taxas de mortalidade em todo o arco da vida humana, resultado da melhoria das condições de vida e de avanços substanciais no tratamento e cura de algumas das principais causas de morte. Esta redução não é homogénea quando considerada por grupos socioeconómicos assumindo, regra geral, uma correlação positiva com o nível de rendimento, riqueza e qualificação dos indivíduos, e apresenta diferenças entre sexos (NASEM, 2015; Ayuso, Bravo e Holzmann, 2017a; Ayuso, Bravo e Holzmann 2017b). Estes ganhos de longevidade constituem, naturalmente, uma alteração positiva para os indivíduos e uma significativa conquista civilizacional das sociedades modernas, mas colocam novos e importantes desafios em múltiplas áreas de intervenção pública e privada como, por exemplo, a sustentabilidade dos sistemas públicos de saúde e de protecção social, a educação ao longo da vida, o planeamento do território, as políticas de habitação e de segurança (Bravo, 2016). As projecções de mortalidade são usadas por organismos oficiais de estatística na produção de projecções de população residente determinando, em conjunto com os fluxos migratórios internacionais e a fecundidade, a dinâmica do efectivo populacional e a sua distribuição por idade e sexo (Bravo & Coelho, 2019).

As projecções de mortalidade e de esperança de vida são um elemento essencial na avaliação e na gestão do risco em seguros do ramo vida (e.g., rendas vitalícias) e em planos e fundos de pensões, sejam eles públicos ou privados, dada a natureza de muito longo prazo dos compromissos assumidos e o actual contexto de taxas de juro baixas ou negativas (Bravo e El Mekkaoui de Freitas, 2018; Blake et al, 2019; Bravo, 2020; Bravo, 2019), no pricing de soluções de mobilização da riqueza imobiliária (equity release schemes) e na avaliação de instrumentos de mercado de capitais para a cobertura dos riscos de longevidade e de mortalidade, por exemplo, longevity bonds, q-forwards, longevity swaps/options (Bravo & Nunes, 2021).

Um denominador comum nas reformas realizadas nos sistemas de pensões da OCDE para responder ao aumento da esperança de vida e ao envelhecimento da população tem sido a criação de mecanismos automáticos de indexação das pensões à esperança de vida (OCDE, 2017). A criação de factores de sustentabilidade (e.g., Portugal, Espanha), a indexação automática da idade de reforma à esperança de vida (e.g., Dinamarca, Portugal), a indexação das condições de acesso às prestações, a fixação de bonificações (penalizações) por reforma postecipada (antecipada) (e.g., Portugal), a introdução de estabilizadores automáticos (e.g., Suécia), são apenas alguns exemplos desta tendência. Esta opção política socorreu-se, contudo, de uma medida errada da longevidade humana, a esperança de vida por período, uma métrica que assume que as condições de mortalidade são estáticas, em detrimento de uma estimativa mais aproximada da vida residual dos indivíduos representada pela esperança de vida por coorte, que incorpora a dinâmica esperada das probabilidades de sobrevivência da população (Ayuso, Bravo e Holzmann, 2020). O cálculo da esperança de vida por coorte pressupõe a utilização de métodos estocásticos de projecção das taxas de mortalidade específicas por idade e sexo. Na literatura demográfica e actuarial, são inúmeros os modelos propostos para este fim agrupados, regra geral, em métodos de natureza paramétrica, principal component methods, e métodos de graduação (Lee e Carter, 1992; Brouhns et al, 2002; Renshaw e Haberman, 2006; Currie, 2006; Cairns et al, 2006; Cairns et al, 2009; Hyndman e Ullah, 2007; Plat, 2009; Hunt e Blake, 2020). Estas projecções não estão isentas dos riscos de modelo e de estimação dos parâmetros.

Neste artigo seguimos (Bravo, Ayuso, Holzmann e Palmer, 2020) e ensaiamos a aplicação à população portuguesa em idade adulta de uma abordagem inovadora em estudos demográficos e actuariais que envolvem modelos competitivos assente numa combinação Bayesiana de modelos (Bayesian Model Ensemble, BME) heterogéneos. Quando comparada com abordagens assentes em modelo único, a abordagem BME demonstrou em variados estudos empíricos um poder preditivo superior aos métodos de machine learning, com a vantagem de que reduz o risco de modelo e diversifica as covariáveis usadas na projecção. A combinação usada no estudo inclui nove modelos candidatos, seis dos quais modelos generalizados idade-periodo-coorte, o método de séries temporais de Hyndman e Ullah ponderado, um modelo assente na análise de componentes principais regularizada, e a técnica de P-Splines bidimensional com penalização. Os modelos são calibrados à população portuguesa desagregada por sexo usando informação estatística obtida da (Human Mortality Database, 2020) relativa ao período 1960-2018 e às idades adultas no intervalo 60-125. A escolha particular deste intervalo de idades prende-se com a sua relevância para a análise da sustentabilidade dos sistemas públicos e privados de protecção social e de saúde em Portugal. São ainda calculados intervalos de confiança para a combinação de modelos usando a metodologia Model-Averaged Tail Area (MATA). O estudo apresenta e analisa os resultados da aplicação da metodologia à população portuguesa e discute as suas implicações nalgumas áreas de intervenção. O resto do artigo está organizado da seguinte forma. Na Secção 2 é apresentada a metodologia usada no estudo e os procedimentos adoptados para a sua implementação. Na Secção 3 são apresentados e discutidos os principais resultados para a evolução projectada da mortalidade e da esperança de vida em Portugal. A Secção 4 resume as principais conclusões e contributos da investigação.

2. Metodologia

2.1. Combinação Bayesiana de modelos

A metodologia tradicional de projecção da mortalidade envolve a utilização de um único modelo seleccionado de um conjunto restrito de alternativas, usando um método ou um critério (e.g., BIC, AIC, métrica de avaliação do poder preditivo, testes de hipóteses para selecção de modelos encaixados, cross-validation, bootstrapping), frequentemente sem considerar o risco de modelo. O método seleccionado é então considerado como o «verdadeiro» (o melhor) para efeitos de inferência estatística, uma escolha que implicitamente limita (reduz) a incerteza na projecção uma vez que ignora o risco de modelo. Para contornar esta limitação, neste artigo acompanhamos (Bravo et al, 2020) e usamos uma abordagem alternativa baseada numa combinação adaptativa de modelos heterogéneos que inclui seis modelos generalizados idade-periodo-cohorte (Generalised Age-Period-Cohort (GAPC) models), o método de séries temporais de Hyndman e Ullah ponderado (Shang et al, 2011), um modelo assente numa análise de componentes principais regularizada (Regularized Singular Value Decomposition, RSVD) e a técnica de P-splines bidimensional (two-dimensional smooth constrained P-splines).

A combinação de modelos consiste na aplicação da teoria Bayesiana à selecção de modelos e à inferência estatística em contexto de incerteza quanto ao melhor modelo. A combinação adaptativa adoptada neste artigo é inspirada no conceito de model confidence set proposto por (Hansen et al, 2011) e usado, por exemplo, por (Samuels e Sekkel, 2017) e (Bravo et al, 2020). O pressuposto é o de que a combinação de modelos deve ser precedida de uma selecção prévia de um subconjunto de melhores modelos, usando para tal um critério de escolha (e.g., poder preditivo do modelo). Designemos por os modelos candidatos, representando o conjunto de distribuições de probabilidade (PDF) que compreendem a função de verosimilhança dos dados observados em termos dos parâmetros específicos de cada modelo e um conjunto de funções de densidade de probabilidade prévias Seja a variável de interesse presente em todos os modelos, por exemplo, o valor futuro de . Segundo a lei de probabilidade total, a distribuição marginal posterior da variável de interesse considerando os modelos é definida por

1

onde designa a distribuição de probabilidade projectada de com base no modelo e representa a probabilidade posterior do modelo estimada a partir dos dados (lookforward window), ou seja, espelhando a sua aderência aos dados ou o seu poder preditivo. A distribuição à posteriori do modelo é dada por

2

onde

3

As probabilidades à posteriori dos modelos totalizam a unidade, i.e., e podem ser interpretadas como ponderadores (pesos). A distribuição de probabilidade da combinação de modelos BME é assim uma média ponderada das PDF dos modelos individuais, em que os ponderadores são as suas probabilidades à posteriori (Raftery et al., 2005). Para identificar os modelos que integram o model confidence set e respectivos ponderadores na BME, para cada uma das três subpopulações os modelos são, numa primeira fase, estimados na amostra de treino (training set) e posteriormente hierarquizados segundo o seu poder preditivo na amostra de teste (out-of-sample test set). Foram consideradas diferentes métricas de avaliação do poder preditivo (MAPE, RMSE, SMAPE, SSE, etc.) optando-se, finalmente, pelo indicador Symmetric Mean Absolute Percentage Error (SMAPE) para o cálculo dos ponderadores, uma variante do erro percentual médio bastante usada em competições internacionais de modelos de previsão. O SMAPE do modelo e subpopulação é definido por

4

onde e denotam, respectivamente, as estimativas pontuais e os valores observados das taxas de mortalidade, , , , , . As amostras de treino e de teste são definidas de modo a permitir um horizonte de previsão de 5 anos em todos os modelos e subpopulações. Os dados estatísticos sobre a mortalidade e a exposição ao risco foram extraídos do repositório internacional (Human Mortality Database (2020). O computo das probabilidades à posteriori dos modelos socorre-se da função exponencial normalizada (também conhecida por função softmax ou softargmax), definida por

5

onde simboliza o valor da métrica SMAPE do modelo Esta função atribui um peso maior aos modelos com melhor desempenho preditivo, seguindo os pesos uma função exponencial. Identificado o model confidence set e calculado o seu peso relativo, da aplicação da equação (1) obtemos uma combinação probabilística de taxas de mortalidade, com base nas quais se calculam as esperanças de vida por período e coorte. A derivação de intervalos de confiança para a combinação de modelos socorre-se da metodologia Model-Averaged Tail Area (MATA) desenvolvida por (Turek and Fletcher, 2012), assente numa média ponderada de intervalos de credibilidade Bayesianos.

2.2. Modelos estocásticos de projecção da mortalidade

A Tabela 1 resume os nove modelos estocásticos de projecção da mortalidade usados neste estudo, escolhidos com base no seu desempenho empírico em estudos similares (Cairns et al., 2009; Dowd et al, 2010; Bravo et al, 2020). O conjunto base compreende seis modelos do tipo GAPC, modelos paramétricos da classe dos modelos lineares generalizados (GLM) que vinculam a variável de resposta a um previsor linear ou bilinear que inclui, como variáveis explicativas, a idade do indivíduo, , o tempo cronológico e a geração (ano) de nascimento (ou coorte), , a que acrescem restrições de identificação dos modelos, uma função link e métodos univariados de séries para obter projecções (Hunt e Blake, 2020). A componente aleatória dos modelos assume que o número de óbitos à idade no ano segue uma distribuição de Poisson com ou uma distribuição Binomial com onde e denotam, respectivamente, a população inicialmente ou centralmente exposta ao risco, e e denotam a taxa de mortalidade e a probabilidade de morte à idade no ano . A componente sistemática do modelo liga a variável de resposta ( ou ) a um determinado previsor linear

6

onde representa a configuração geral da mortalidade por idade, refere um conjunto de termos idade-período que descrevem as tendências globais na mortalidade, sendo um índice temporal e um parâmetro de sensibilidade por idade, e o termo compreende os efeitos geracionais, sendo um parâmetro modulador por idade. Os índices temporais e geracionais são processos estocásticos, modelados através de métodos univariados de séries temporais ARIMA(p,d,q) usando a metodologia de Box-Jenkins.

Tabela 1 Modelos estocásticos de projecção da mortalidade 

(Brouhns et al. 2002; Currie 2006; Renshaw e Haberman 2006; Cairns et al 2006; Cairns et al. 2009; Plat 2009; Shang et al.2011; Camarda 2019; Huang et al. 2009)

Fonte: Elaboração própria.

O subconjunto de modelos GAPC usados neste estudo compreende: [LC] o modelo Poisson-Lee-Carter (Brouhns et al., 2002); [APC] o modelo idade-período-coorte de (Currie 2006); [RH] a extensão do modelo de Lee-Carter incluindo efeitos coorte e (Renshaw e Haberman, 2006); [CBD] o modelo Cairns-Blake-Dowd com e onde denota a idade média na amostra (Cairns et al, 2006); [M7] a extensão do modelo CBD incluindo efeitos coorte (Cairns et al., 2009); [Plat] o modelo de Plat (2009) com . Os parâmetros são estimados usando métodos de máxima-verosimilhança. O fecho das tábuas de mortalidade à idade limite socorre-se do método de (Denuit e Goderniaux, 2005). Alguns dos modelos GAPC descritos na Tabela 1 são casos particulares de modelos mais gerais. Por exemplo, o modelo LC é encaixado no modelo RH assumindo , e sendo igualmente um caso particular do modelo APC com e sem efeitos coorte. A metodologia BME usada neste estudo selecciona, em cada população, o subconjunto de modelos GAPC encaixados que apresenta melhor desempenho preditivo e exclui do model confidence set os restantes (três dos seis candidatos) usando uma fixed-rule trimming scheme. Para cada modelo individual, são usados métodos de bootstrap semi-paramétricos para derivar intervalos de confiança para as variáveis de interesse considerando um total de 10000 simulações (Brouhns et al., 2005).

O leque de métodos de projecção da mortalidade usados no estudo compreende ainda o modelo demográfico funcional (Functional Demographic Model (FDM)) assente numa análise de componentes principais desenvolvido originalmente por (Hyndman e Ullah, 2007) e expandido por (Shang et al, 2011). Formalmente,

7

onde , são funções contínuas e suaves da idade, é um parâmetro de volatilidade ajustável com a idade e período , e é um ruído branco. Este estudo considera ainda a técnica de P-Splines bidimensional com penalização proposta por (Camarda, 2019), descrita formalmente pela matriz de regressão

8

onde é um vector de parâmetros e designa o produto de Kronecker de bases B-splines igualmente espaçadas para a idade e ano , complementadas com uma penalização bidimensional e restrições de modo a assegurar projecções biologicamente plausíveis para a mortalidade. Por fim, o estudo inclui ainda a abordagem bidimensional (por idade e período) assente na análise de componentes principais regularizada proposta por (Huang et al, 2009). Em termos formais, os autores assumem que

9

onde designa a taxa de mortalidade, o valor próprio, e são funções suaves da idade e período, respectivamente, e um ruído branco. Para obter projecções e intervalos de confiança, as funções são modeladas como séries temporais usando processos estocásticos do tipo ARIMA. As tarefas de estimação, simulação e projecção dos modelos e aplicação da abordagem BME foram concretizadas com recurso a uma rotina informática escrita em software R.

2.3. Cálculo da Esperança de Vida

Seja a probabilidade de sobrevivência -anos de um indivíduo à idade no ano

10

onde denota a intensidade de mortalidade estocástica. Na discretização do processo estocástico, assumimos que é constante no interior de cada quadrado do diagrama de Lexis. Formalmente, para e números inteiros, assume-se que para , donde decorre que: (i) é estimada pela taxa central de mortalidade , (ii) a probabilidade anual de sobrevivência é dada por A esperança de vida por coorte de um indivíduo com idade no ano , pertencente à população , é dada por

11

enquanto que a respectiva esperança de vida por período é calculada segundo

12

O conceito de gap de esperança de vida (life expectancy gap), , corresponde à diferença sistemática entre a esperança de vida por coorte e período (Ayuso et al., 2020). O seu valor expressa uma estimativa dos anos de vida adicionais (a menos) que uma determinada geração usufruirá em resultado dos ganhos (perdas) de longevidade esperados. Um valor positivo (negativo) sinaliza um aumento (redução) esperado da esperança de vida para uma dada geração. O seu valor é calculado mediante

13

3. Análise e Discussão dos Resultados

3.1. Definição do model confidence set e ponderadores

A Figura 1 representa, para os nove modelos candidatos, as curvas de mortalidade ajustadas no intervalo de idades 60-95 e training set (período 1960-2013) considerando o conjunto da população portuguesa. Como se observa, o normal aumento da mortalidade com a idade antecipado nestas idades e a dinâmica multidimensional de aumento continuado da longevidade são captados de forma distinta pelos diferentes métodos usados, constatando-se, por exemplo, que alguns modelos (e.g., M7) apresentam uma qualidade de ajustamento deficiente. A análise dos resíduos dos modelos confirma esta conclusão. Os ganhos de longevidade observados não são homogéneos ao longo de todo o espectro de idades analisado, sendo mais significativos nas idades compreendidas entre os 60 e 80 anos, consequência dos avanços registados nas últimas décadas no tratamento das doenças cardiovasculares e do cancro. A maioria dos modelos revela uma boa qualidade de ajustamento, como se observa nos indicadores reportados na Tabela 2 para a população total. Considerando, por exemplo, a métrica SMAPE, o modelo APC apresenta o melhor desempenho preditivo na amostra de teste, seguido dos modelos HUw, CPspl e do modelo RSVD. Os resultados obtidos considerando outras métricas de avaliação não alteram grosso modo esta hierarquização da capacidade preditiva na população total portuguesa, registando-se desempenho similar nas subpopulações masculina e feminina.

A Figura 2 ilustra a aplicação da metodologia BME adaptativa representando não apenas os modelos seleccionados para efectuar a BME, como os respectivos ponderadores, calculados através da função exponencial normalizada. A Figura explicita o contributo individual de cada modelo para a projecção da mortalidade e da esperança de vida e reflecte o diferente poder preditivo dos modelos seleccionados. A análise da Figura 2 permite verificar, na população total e subpopulações masculina e feminina, que os modelos LC, RH e M7 foram preteridos na combinação final em resultado da selecção prévia de modelos encaixados com melhor desempenho preditivo. A combinação Bayesiana de modelos seleccionada nas três subpopulações é idêntica, não significando tal que os ponderadores usados em cada subpopulação são os mesmos, dado que esta é função do diferente desempenho preditivo constatado em cada caso e este não é idêntico na amostra. Os modelos com maior contributo para a combinação final de modelos são os que apresentam os valores mais reduzidos na métrica SMAPE, ou seja, os modelos APC, HUw, CPspl e RSVD.

Figura 1  Quocientes de mortalidade ajustados, por modelo, População TotalNota: valores em escala logarítmica. Em cada gráfico, os valores mais baixos correspondem aos anos de observação mais recentes 

Tabela 2 Métricas de avaliação dos modelos de projecção da mortalidade, População Total 

Modelo
Métrica LC APC CBD Plat M7 RH HUw CPspl RSVD
MAE 0,00349 0,00334 0,00772 0,00806 0,00793 0,00713 0,00365 0,00435 0,00415
MAPE 0,04772 0,04212 0,07079 0,08709 0,17877 0,05498 0,04545 0,04747 0,04953
MASE 0,24415 0,24128 0,45738 0,49060 0,50616 0,37641 0,27165 0,33397 0,31772
MDAE 0,00159 0,00125 0,00197 0,00379 0,00572 0,00113 0,00139 0,00139 0,00101
MSE 0,00004 0,00004 0,00023 0,00022 0,00014 0,00036 0,00004 0,00007 0,00007
RMSE 0,00610 0,00656 0,01515 0,01481 0,01175 0,01887 0,00643 0,00843 0,00820
RMSLE 0,00510 0,00538 0,01209 0,01187 0,00982 0,01448 0,00538 0,00695 0,00680
RMSPE 0,05816 0,05207 0,08451 0,09895 0,25126 0,07409 0,05626 0,05962 0,06351
RRSE 0,07636 0,08419 0,16599 0,16294 0,13739 0,20283 0,08280 0,11200 0,10805
RSE 0,00583 0,00709 0,02755 0,02655 0,01888 0,04114 0,00686 0,01254 0,01168
SMAPE 0,04839 0,04236 0,07378 0,09192 0,17570 0,05725 0,04607 0,04727 0,04809
SSE 0,00669 0,00774 0,04129 0,03950 0,02486 0,06410 0,00744 0,01279 0,01212

Notas: MAE: mean average error; MAPE: mean average percentage error; MASE: mean absolute scaled error; MDAE: median absolute error; MSE: mean squared error; RMSE: root mean squared error; RMSLE: root mean squared log error; RMSPE: root mean square percentage error; RRSE: root relative squared error; RSE: relative squared error; SMAPE: symmetric mean absolute percentage error; SSE: error sum of squares.

Figura 2 Model confidence set e respectivos ponderadores por subpopulação 

3.2. Projecções de mortalidade e de esperança de vida

A Figura 3 apresenta a projecção da esperança de vida à idade 60 por período e por coorte no período 1960-2050, desagregada por sexo. Os resultados obtidos permitem concluir que o modelo de previsão antecipa, para ambos os sexos, a continuação da tendência de crescimento quase linear da esperança de vida registada nas últimas décadas. Em 1960, a esperança de vida por coorte na aproximação à idade de saída do mercado de trabalho era de cerca de 20 anos para as mulheres e de 16 anos para os homens. Neste estudo prevemos que em 2050 a esperança de vida das mulheres aos 60 anos suba para um valor superior a 32 anos (27 anos no caso dos homens), ou seja, antecipamos um aumento da longevidade e do gradiente entre homens e mulheres.

Figura 3 Projecção da esperança de vida por período e por coorte, por sexo 

Este incremento contribui para o envelhecimento do topo da estrutura etária da população portuguesa, já de si hoje muito significativo, com implicações relevantes na dinâmica do mercado de trabalho, na sustentabilidade dos sistemas de protecção social financiados em repartição contemporânea e na capacidade e adequação dos sistemas públicos e privados de saúde e de apoio à dependência. O diferencial sistemático entre a esperança de vida por coorte e por período (life expectancy gap) é positivo para todas as subpopulações e anos analisados e não evidencia sinais de redução, o que significa que os indicadores por período actualmente usados nos organismos oficiais de estatística (e.g., pelo Instituto Nacional de Estatística) para estimar a longevidade remanescente da população e analisar os níveis de envelhecimento subestimam sistematicamente a «verdadeira» esperança de vida da população, introduzem impostos/subsídios implícitos entre gerações no sistema de protecção social, e distorcem as decisões de participação no mercado de trabalho, de consumo ou de poupança, com implicações nos pension entitlements (Bravo e Herce, 2020). A Figura 4 representa a previsão pontual e o intervalo de confiança do gap de esperança de vida à idade 60 no conjunto da população portuguesa no período entre 1960 e 2050. Os resultados obtidos confirmam o crescimento do gap no período analisado e uma estabilização em torno dos 2 anos, com um limite superior do intervalo de confiança que pode chegar aos 6 anos em 2050.

Figura 4 Life expectancy gap à idade 60: Previsão e intervalo de confiança, População Total 

O gap é um indicador da injustiça actuarial intergeracional do sistema de pensões na medida em que sinaliza o número de anos de pagamento de prestações sociais que as gerações de actuais beneficiários usufruirão em excesso face às contribuições sociais que efectuaram durante a vida activa (em conjunto com as das respectivas entidades empregadoras). A este imposto implícito de cerca de 10% da riqueza em pensões (pension wealth) pago pelas actuais gerações de trabalhadores no activo acrescem outros que resultam dos diferenciais de longevidade entre grupos socioeconómicos e entre sexos, por exemplo. A sua redução/eliminação requer a adopção de reformas nos sistemas de protecção social (e.g., aumento da idade normal de reforma, alteração do mecanismo de indexação das pensões em pagamento, reformulação do factor de sustentabilidade) e a utilização de métricas adequadas da longevidade da população.

4.Conclusões

As previsões de longevidade da população são comummente realizadas com base num único método estocástico, assumindo que este representa da melhor forma a incerteza. Os resultados da aplicação de um modelo de previsão da mortalidade assente numa combinação Bayesiana de modelos heterogéneos evidenciam que esta escolha comporta significativos riscos de modelo e que a incerteza associada a previsões de longo prazo da longevidade da população é melhor representada por combinações de modelos com diferentes características. As projecções de esperança de vida por período e por coorte nas idades adultas apontam para a manutenção da tendência de crescimento da esperança de vida, para a existência de um gap significativo entre os indicadores por período e por coorte (e por sexo). Estes resultados, em conjunto com a existência de gradientes significativos na longevidade por grupo socioeconómico, confirmam a existência nos sistemas de protecção social de impostos/subsídios implícitos entre gerações que distorcem as decisões de consumo, de mercado de trabalho e de poupança e questionam a justiça intergeracional. A sua redução exige uma avaliação mais rigorosa da longevidade da população por parte dos decisores públicos e privados e a utilização de métodos de projecção mais robustos que incorporem todas as fontes de incerteza.

Agradecimentos

J. Bravo is supported by Portuguese national funds through FCT under the project UIDB/04152/2020 - Centro de Investigação em Gestão de Informação (MagIC).

M. Ayuso is grateful to the Spanish Ministry of Science and Innovation for funding received under grant PID2019-105986GB-C21.

Referências

Ashofteh, A. & Bravo, J. M. (2019). A non-parametric-based computationally efficient approach for credit scoring Atas da Conferencia da Associação Portuguesa de Sistemas de Informação 2019. [ Links ]

Ayuso, M., Bravo, J. M., & Holzmann, R. (2017a). On the heterogeneity in longevity among socioeconomic groups: Scope, trends, and implications for Earnings-Related Pension Schemes. Global Journal of Human Social Sciences-Economic, 17(1), 31-57. [ Links ]

Ayuso, M., Bravo, J. M., & Holzmann, R. (2017b). Addressing longevity heterogeneity in pension scheme design. Journal of Finance and Economics, 6(1), 1-21. [ Links ]

Ayuso, M., Bravo, J. M., & Holzmann, R. (2020). Getting Life Expectancy Estimates Right for Pension Policy: Period versus Cohort Approach. Journal of Pension Economics and Finance, 1-20. https://doi.org/10.1017/S1474747220000050. [ Links ]

Blake, D., Cairns, A. J., Dowd, K. & Kessler, A. (2019). Still living with mortality: The longevity risk transfer market after one decade. British Actuarial Journal, 24, 1-80. [ Links ]

Bravo, J. M. & Coelho, E. (2019). Forecasting Subnational Demographic Data using Seasonal Time Series Methods. Atas da Conferencia da Associação Portuguesa de Sistemas de Informação 2019. [ Links ]

Bravo, J. M. (2016). Taxation of Pensions in Portugal: A Semi-Dual Income Tax System. CESifo DICE Report - Journal for Institutional Comparisons. 14 (1), 14-23. [ Links ]

Bravo, J. M. (2019). Funding for longer lives: Retirement wallet and risk-sharing annuities. Ekonomiaz, 96(2), 268-291. [ Links ]

Bravo, J. M. (2020). Longevity-Linked Life Annuities: A Bayesian Model Ensemble Pricing Approach. Atas da Conferencia da Associação Portuguesa de Sistemas de Informação 2020. [ Links ]

Bravo, J. M., & El Mekkaoui de Freitas, N. (2018). Valuation of longevity-linked life annuities. Insurance: Mathematics and Economics, 78, 212-229. [ Links ]

Bravo, J. M., Ayuso, M., Holzmann, R., & Palmer, E. (2020). Addressing the Life Expectancy Gap in Pension Policy. Insurance: Mathematics and Economics, Accepted/In press. [ Links ]

Bravo, J. M., & Herce, J. A. (2020). Career breaks, Broken pensions? Long-run effects of early and late-career unemployment spells on pension entitlements. Journal of Pension Economics and Finance 1-27. https://doi.org/10.1017/S1474747220000189 [ Links ]

Bravo, J. M., & Nunes, J. P. V. (2020). Pricing Longevity Derivatives via Fourier Transforms. Insurance: Mathematics and Economics , 96, 81-97. [ Links ]

Bravo, J. M., & Silva, C. M. (2006). Immunization Using a Stochastic Process Independent Multifactor Model: The Portuguese Experience. Journal of Banking and Finance, 30 (1), 133-156. [ Links ]

Brouhns, N., Denuit, M., & Van Keilegom, I. (2005). Bootstrapping the Poisson Log-Bilinear Model for Mortality Forecasting. Scandinavian Actuarial Journal, 3, 212-224. [ Links ]

Brouhns, N., Denuit, M., & Vermunt, J. (2002). A Poisson Log-Bilinear Regression approach to the construction of projected life tables. Insurance: Mathematics and Economics , 31, 373-393. [ Links ]

Cairns, A., Blake, D. & Dowd, K. (2006). A two-factor model for stochastic mortality with parameter uncertainty: Theory and calibration. Journal of Risk and Insurance, 73, 687-718. [ Links ]

Cairns, A., Blake, D., Dowd, K., Coughlan, G., Epstein, D., Ong, A, & Balevich, I (2009). A quantitative comparison of stochastic mortality models using data from England and Wales and the United States. North American Actuarial Journal, 13(1), 1-35. [ Links ]

Camarda, C. G. (2019). Smooth constrained mortality forecasting. Demographic Research, 41(38), 1091-1130. [ Links ]

Chamboko, R. & Bravo, J. M. (2019). Frailty correlated default on retail consumer loans in developing markets. International Journal of Applied Decision Sciences, 12(3), 257-270. [ Links ]

Chamboko, R. & Bravo, J. M. (2019). Modelling and forecasting recurrent recovery events on consumer loans. International Journal of Applied Decision Sciences , 12(3), 271-287. [ Links ]

Chamboko, R., & Bravo, J. M. (2016). On the modelling of prognosis from delinquency to normal performance on retail consumer loans. Risk Management, 18(4), 264-287. [ Links ]

Chamboko, R., & Bravo, J. M. (2020). A Multi-State Approach to Modelling Intermediate Events and Multiple Mortgage Loan Outcomes. Risks, 8, 64. [ Links ]

Currie, I. (2006). Smoothing and forecasting mortality rates with P-Splines. DP Heriot Watt University. [ Links ]

Denuit, M., & Goderniaux, A. C. (2005). Closing and projecting life tables using log-linear models. Bulletin of the Swiss Association of Actuaries, 1, 29-48. [ Links ]

Dowd, K., Cairns, A., Blake, D., Coughlan, G., Epstein, D. & Khalaf-Allah, M. (2010). Backtesting stochastic mortality models. North American Actuarial Journal, 14(3), 281-298. [ Links ]

Hansen, P., Lunde, A., & Nason, J. (2011). The model confidence set. Econometrica, 79, 453-497. [ Links ]

Huang, J. Z., Shen, H. & Buja, A. (2009). The analysis of two-way functional data using two-way regularized singular value decompositions. Journal of the American Statistical Association 104 (488), 1609-1620. [ Links ]

University of California, Max Planck Institute for Demographic Research (2020). Human Mortality Database . https://www.mortality.org/Links ]

Hunt, A., & Blake, D. (2020). On the structure and classification of mortality models. North American Actuarial Journal . https://doi.org/10.1080/10920277.2019.1649156 [ Links ]

Hyndman, R., & Ullah, S. (2007). Robust forecasting of mortality and fertility rates: A functional data approach. Computational Statistics & Data Analysis, 51, 4942-4956. [ Links ]

Laureano, R. M. S., Caetano, N. & Cortez, P. (2014). Previsão de tempos de internamento num hospital português: aplicação da metodologia CRISP-DM. RISTI - Revista Ibérica de Sistemas e Tecnologias de Informação, 13, 83-98, http://dx.doi.org/10.4304/risti.13.83-98. [ Links ]

Lee, R., & Carter, L. (1992). Modeling and forecasting U.S. mortality. Journal of the American Statistical Association , 87(419), 659-671. [ Links ]

National Academy of Sciences, Engineering and Medicine (2015). The growing gap in life expectancy by income: Implications for federal programs and policy responses. Washington, DC: National Academies Press. [ Links ]

OECD (2017). Pensions at a Glance 2017: OECD and G20 Indicators. OECD Publishing. [ Links ]

Plat, R. (2009). On stochastic mortality modeling. Insurance: Mathematics and Economics , 45(3), 393-404. [ Links ]

Raftery, A., Gneiting, T., Balabdaoui, F., & Polakowski, M. (2005). Using Bayesian Model Averaging to calibrate forecast ensembles. Journal of American Meteorological society, 133, 1155-1174. [ Links ]

Ramírez-Alpízar, A, Jenkins, M., Martínez, A., Quesada-López, C. (2020). Use of data mining and machine learning techniques for fraud detection in financial statements: A systematic mapping study. RISTI - Revista Ibérica de Sistemas e Tecnologias de Informação , (E28-04), 97-109. [ Links ]

Renshaw, A., & Haberman, S. (2006). A cohort-based extension to the Lee-Carter Model for mortality reduction factors. Insurance: Mathematics and Economics , 38(3), 556-570. [ Links ]

Samuels, J.D., & Sekkel, R.M. (2017). Model confidence sets and forecast combination. International Journal of Forecasting, 33(1), 48-60. [ Links ]

Shang, H.L., Booth, H., & Hyndman, R.J. (2011). Point and interval forecasts of mortality rates and life expectancy: A comparison of ten principal component methods. Demographic Research 25, 173-214. [ Links ]

Turek, D. & Fletcher, D. (2012). Model-Averaged Wald Confidence Intervals. Computational Statistics and Data Analysis, 56(9), 2809-2815. [ Links ]

1Nestes contratos, os riscos de longevidade, de crédito e de taxa de juro assumem-se como os principais determinantes do valor de mercado. Para uma discussão sobre diferentes métodos de avaliação e gestão dos riscos de crédito e de taxa de juro veja-se, por exemplo, (Bravo e Silva, 2006), (Chamboko e Bravo, 2016), (Chamboko e Bravo, 2019a), (Chamboko e Bravo, 2019b), (Chamboko e Bravo, 2020) e (Afshin e Bravo, 2019).

2Veja, e.g., (Ramírez-Alpízar et al, 2020) para uma listagem de métricas de avaliação do desempenho preditivo em técnicas de data mining e machine learning.

Recebido: 30 de Setembro de 2020; Aceito: 10 de Novembro de 2020

Corresponding author: jbravo@novaims.unl.pt

Creative Commons License Este é um artigo publicado em acesso aberto sob uma licença Creative Commons