Tamanho da fonte:
UTILIZAÇÃO DE FERRAMENTAS DE APRENDIZADO DE MÁQUINA PARA A PREDIÇÃO DO RISCO DE ÓBITO POR COVID-19 ASSOCIADO A COMORBIDADES
Última alteração: 2022-10-05
Resumo
A pandemia da doença coronavírus 2019 (COVID-19) levou a uma disseminação mundial sem precedentes do vírus SARS-CoV-2 causando um efeito devastador nas populações, nas estruturas sociais e no crescimento econômico, além de impor sérios desafios às instalações de saúde e à infraestrutura médica, se tornando uma emergência global (SREEPADMANABH; SAHU; CHANDE, 2020). Condições pré-existentes, como doença cardiovascular, doença renal crônica, doenças pulmonares crônicas, diabetes mellitus, hipertensão, imunossupressão, obesidade e doença falciforme, predispõem os pacientes a um curso clínico desfavorável e aumento do risco de intubação e morte pela doença (MARIN et al., 2020). A identificação de fatores de risco potenciais que predizem o curso da doença pode ser de grande utilidade para profissionais de saúde para triagem eficiente de pacientes, personalizar o tratamento, monitorar o progresso clínico e alocar recursos adequados em todos os níveis de atendimento para mitigar a morbidade e a mortalidade (MARIN et al., 2020). Neste contexto, dados em grande escala de pacientes com COVID-19 podem ser integrados e analisados por algoritmos de aprendizado de máquina avançados para entender melhor o padrão de propagação viral, melhorar ainda mais a velocidade e precisão do diagnóstico, desenvolver novas abordagens terapêuticas eficazes e, potencialmente, identificar as pessoas mais suscetíveis com base em características genéticas e fisiológicas personalizadas (ALIMADADI et al., 2020). Desta maneira, este estudo tem o objetivo de predizer o risco de óbito em pacientes com COVID-19, que apresentam comorbidades, por meio de técnicas de classificação de aprendizado de máquina. Como material e métodos utilizou-se dados, disponíveis publicamente da fundação SEADE, de 39.349 indivíduos diagnosticados com COVID-19 no estado de São Paulo, os dados foram obtidos no mês de abril de 2021 (SEADE, 2021). As análises estatísticas foram realizadas no programa R v. 4.0.3 (R CORE TEAM, 2020). Os dados foram divididos aleatoriamente, utilizando o método de particionamento de amostragem randômico - Holdout (NWANGANGA et al., 2020), em dois conjuntos: Treinamento e Teste. O conjunto de treinamento do modelo correspondeu a 70% dados e o conjunto de teste em 30%. A técnica estatística utilizada foi a Regressão Logística Multivariada com o objetivo de aplicar as técnicas de classificação de aprendizado de máquina adequadas ao problema e, também, com o objetivo de modelar a chance de óbito em função das covariáveis selecionadas pelo algoritmo de seleção automática Stepwise, e com isso quantificar o risco de óbito por COVID-19 em relação a cada comorbidade separada e para indivíduos que apresentam um conjunto delas. Os resultados mostraram que pessoas obesas, pessoas diabéticas e pessoas que sofrem de cardiopatias apresentam respectivamente 1,5, 1,2 e 1,06 vezes mais chances de morrer por COVID-19 se comparado a pessoas que não apresentam essas comorbidades. Além disso, o modelo previu que quanto maior a idade do indivíduo maior é também o risco de óbito por COVID-19. Outras comorbidades e condições preexistentes também foram analisadas no modelo e todas apresentaram significância estatística na predição do risco de morte por COVID-19. Para os dados de teste, o modelo apresentou uma taxa de acerto de 68%, resultado obtido a partir da elaboração da matriz de confusão, ferramenta comumente utilizada para modelos de classificação em aprendizado de máquina. Este trabalho destaca a importância de modelos estatísticos aplicados no aprendizado de máquina para a previsão do risco de óbito em pessoas acometidas pela COVID-19 e com doenças e condições preexistentes no estado São Paulo.
Texto completo:
PDF