SciELO - Scientific Electronic Library Online

 
 issue121Predilection of streams for water quality monitoring: an ecosystem provision service in the Itajaí-Mirim river basin (Brazil).Telework in times of pandemic: from advantages to uncertainties in the daily lives of families living in the Northern Lisbon Metropolitan Area, Portugal. author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • Have no similar articlesSimilars in SciELO

Share


Finisterra - Revista Portuguesa de Geografia

Print version ISSN 0430-5027

Abstract

GIOIA, Thamy Barbara; BARROS, Juliana Ramalho  and  SILVA, Renato Rodrigues da. Fatores socioeconômicos e algoritmos de machine learning aplicados à predição de risco de doenças negligenciadas. Estudo de caso nos municípios do Estado de Goiás e Distrito Federal, Brasil. Finisterra [online]. 2022, n.121, pp.109-123.  Epub Dec 31, 2022. ISSN 0430-5027.  https://doi.org/10.18055/finis28635.

Analisar a relação entre variáveis socioeconômicas e doenças tropicais negligenciadas pode auxiliar gestores no desenvolvimento de políticas públicas para a redução de casos. O objetivo deste trabalho foi avaliar, com base em algoritmos de machine learning, quais as variáveis socioeconômicas mais importantes para a classificação de risco de três doenças negligenciadas: hanseníase, leishmaniose tegumentar e dengue. Foram avaliados três algoritmos embasados em árvores de decisão: Random Forest (RF), XGBoost e C5.0. Como área de estudo, delimitaram-se os municípios do Estado de Goiás e o Distrito Federal - Brasil. Para as classes de risco de dengue, tanto o algoritmo RF quanto o XGBoost apresentaram valores de acurácia acima de 0,6. Ambos destacaram como variáveis preditivas mais importantes as condições de baixa renda, alfabetização e raça. No caso das classes de risco de hanseníase, os três algoritmos apresentaram resultados de acurácia acima de 0,6 indicando como importantes as variáveis abastecimento de água, alfabetização, raça e moradia. No caso das classes de risco de leishmaniose tegumentar, os algoritmos apresentaram acurácia inferior a 0,4 inviabilizando a avaliação das possíveis variáveis preditivas ao modelo. Os três algoritmos avaliados apresentaram desempenho preditivo aproximados, no entanto, o RF foi ligeiramente superior. As variáveis socioeconômicas mais importantes para predição das classes de risco de dengue e hanseníase foram similares.

Keywords : Doenças tropicas negligenciadas; determinantes sociais; XGBoost; Random Forest; C5.0.

        · abstract in English | French | Spanish     · text in English     · English ( pdf )