Análise preditiva de complicações em pacientes diabéticos

Por: Anderson Soares, Rafael Sousa e Eduardo Prado [*]

Cada vez mais os dados vão ter um papel estratégico na Saúde [1] impulsionados pela evolução e massificação da Inteligência Artificial (IA) [2] nesse segmento.

Um tópico muito importante atualmente na saúde é a Medicina Preditiva que é um campo da medicina que tem como objetivo prever a probabilidade de uma doença e instituir medidas preventivas para prevenir ou diminuir seu impacto sobre o paciente (p. ex., prevenindo a mortalidade ou limitando a morbidade). A Medicina Preditiva será cada vez mais importante no futuro da medicina à medida que mais dados na saúde estejam disponíveis para serem utilizados pela Inteligência Artificial.

Como exemplo, é possível citar o crescente aumento do uso da tecnologia wearable, testes genéticos e outras tecnologias que dão aos pacientes uma quantidade significativa de informações sobre sua própria saúde [4]. Para maiores detalhes sobre Medicina Preditiva ver este relatório de Stanford [5].

A análise preditiva pode ser muito útil na predição de desfechos negativos na área da saúde. Alguns exemplos que poderiam ser implementados seriam: (a) risco de reospitalização para pacientes de ICC (Insuficiência Cardíaca Congestiva) [6-8]; (b) insuficiência renal [9-10]; (c) aplicação para predição de AKI (“Acute Kidney Injury”) renal da Deepmind Google no NHS britânico [11] e (d) diabetes tipo 2 [12].

Em relação a análise preditiva, o Grupo de pesquisa em IA denominado Deep Learning Brasil, sediado na Universidade Federal de Goiás [13] fez um interessante trabalho de predição de desfechos negativos em pacientes diabéticos utilizando apenas os dados das guias de solicitação de serviços de uma operadora de saúde brasileira (sem usar dados dos Prontuários Eletrônicos dos Pacientes) o qual apresentamos a seguir.

Introdução

A diabetes afeta atualmente cerca de 12% da população brasileira, sendo apontada como a quarta causa de morte mais comum no Brasil. A maior parte das mortes ocorrem devido a complicações causadas ou favorecidas pela alta taxa de glicose, por isso é relevante o monitoramento de diabéticos a fim de evitar o surgimento e evolução das complicações. Este tipo de predição pode ser utilizada para prever custos, e também, auxiliar na tomada de decisões relacionadas à prevenção de complicações.

Materiais e métodos

Em parceria com uma operadora de saúde nacional foi realizado um estudo com uso de redes neurais artificiais para a predição de procedimentos graves que são causados por consequência de complicações relacionadas à diabetes. Foi utilizada uma base de registros de procedimentos realizados pelos beneficiários no período compreendido entre 2011 a 2016. Dentre estes pacientes, identificamos os que passaram por procedimentos relacionados a amputações, angioplastias e hemodiálises para a realização do que é conhecido como aprendizado supervisionado. Nesse contexto, outro grupo de controle que nunca apresentou tal estágio foi utilizado. Em cada uma das classes envolvidas no problema foram extraídas séries de cem registros. Dentre os pacientes que realizaram procedimentos graves, as séries antecedem em ao menos 60 dias um dos procedimentos alvo.

Arquitetura de solução

A arquitetura da solução desenvolvida pode ser resumida em três elementos, descritos abaixo, dos quais nos atentaremos somente ao último:

Procedimentos de “Data Clean”;
Uso de técnicas de “bootstrap aggregating”;
Desenvolvimento de um rede neural artificial como estimador

A solução desenvolvida faz uso de uma Rede Neural Recorrente [13.1] com camadas de “Gated Recurrent Units” (GRU) [14] (ver figura abaixo) treinadas para avaliar as séries e reconhecer padrões que podem levar uma pessoa portadora de diabetes a um procedimento grave. A GRU é uma unidade de processamento que possui capacidade de processar séries temporais com uso de operações que atuam como uma memória, alterando seus estados de acordo com os dados anteriores. A unidade - quando treinada de forma supervisionada - tem a capacidade de encontrar padrões de forma a prever os próximos acontecimentos.

“Gated Reccurent Unit”

Duas redes neurais com três camadas e outra com duas foram treinadas e combinadas com uma camada de classificação (ver figura abaixo). Cada camada possui 64 unidades de GRUs e recebe uma entrada de um valor (código de procedimento realizado) para cada um dos 100 tempos.

Resultados

A taxa média de acerto foi de 80% com acurácia de 83% na previsão de um procedimento grave e 79% para a não ocorrência de procedimento grave. A figura abaixo apresenta a área sob a curva ROC de 0.88.

Curva ROC

Por se tratar de um problema com desbalanceamento de classe, apresenta-se na figura abaixo a matriz de confusão obtida nos resultados. Tal estrutura é importante para verificação dos falsos positivos e falsos negativos no contexto do problema considerado.

Matriz de Confusão

Na tabela abaixo apresentamos um resultado didático de um resultado obtido pela solução desenvolvida. A rede neural estimou com sucesso um desfecho grave de um determinado paciente. Certamente para os profissionais, pode parecer lógico a associação entre a realização de um procedimento de Doppler e uma possível complicação. Entretanto, em um conjunto de dados gigantesco como o banco de faturamento de uma operadora de saúde, existem padrões identificados que são inviáveis de serem realizados sem o uso de uma técnica inteligente e automatizada. Nesse contexto, a inteligência artificial apresenta-se como uma importante ferramenta para este processo.

Exemplo de avaliação de paciente grave

Conclusões

Certamente a falta de maturidade no uso de dados é um limitante no desenvolvimento de soluções inteligentes no setor de saúde. Porém, com os desafios existem também as oportunidades. Possivelmente uma das poucas fontes de dados confiáveis existentes são as financeiras. Logo, o uso de tais informações foi a alternativa encontrada para este desafiador estudo de caso.

Os resultados mostraram-se promissores indicando uma chance real de uso efetivo no monitorando de pacientes diabéticos para auxiliar na tomada de decisão das operadoras de saúde. Por fim, foi possível constatar que com o possível uso de outras fontes de informação, a assertividade da solução poderá ser aprimorada e extrapolada para outras situações.

Futuro

A Medicina Preditiva terá um futuro de grande destaque na saúde nos próximos anos. Ela vai interessar a vários players desde operadoras de saúde, integradoras de sistemas, prestadores de serviços de “data science”, hospitais e vários outros.

É natural que a evolução da Medicina Preditiva incorpore novas informações nos seus processos e algoritmos (além das informações clínicas e de exames médicos) tais como: dados dos dispositivos wearable, genômica e microbiota [14.1] que ajudam a qualificar melhor a saúde dos pacientes. Para ver mais detalhes dessa evolução futura da Medicina Preditiva ver as referências [15-16]. Adicionalmente, para maiores do uso de técnicas de “data analytics” em genômica ver a referência [17].

Os dados terão um papel muito importante e transformador da medicina nos próximos anos e serão a base das realizações inovadoras da Medicina Preditiva [18-19].

Referências:

[1] A Nova “Economia de Dados” e a Saúde, Saúde Business, 25.jul.2017

http://saudebusiness.com/nova-economia-de-dados-e-saude/

[2] Artificial Intelligency, Wikipedia

https://en.wikipedia.org/wiki/Artificial_intelligence

[4] Stanford Medicine launches health care trends report, Stanford, 19.jun.2017

https://med.stanford.edu/news/all-news/2017/06/stanford-medicine-launches-health-care-trends-report.html

[5] Stanford Medicine 2017 Health Trends Report: Harnessing the Power of Data in Health, Stanford, June 2017 [pdf]

https://med.stanford.edu/content/dam/sm/sm-news/documents/StanfordMedicineHealthTrendsWhitePaper2017.pdf

[6] BigData Solutions for Predicting Risk-of-Readmission for Congestive Heart Failure Patients, IEEE, 2013 [pdf]

http://cwds.uw.edu/sites/default/files/publications/Big%20Data%20Solutions%20for%20Predicting%20Risk-of-Readmission%20for%20Congestive%20Heart%20Failure.pdf

[7] Societal Impact of Applied Data Science on the Big Data Stack, 14.mar.2015 [ppt]

http://www.slideshare.net/webdatascience/uw-center-for-data-science

[8] VIDEO: Dynamic Hierarchical Classification for Patient Risk-of-Readmission, 14.mar.2015

https://www.youtube.com/watch?v=5lKc5kobn_U

[9] A Predictive Model for Progression of Chronic Kidney Disease to Kidney Failure, JAMA, 14.apr.2011 [PDF here]

https://vincentbourquin.files.wordpress.com/2011/04/jama-2011-tangri-jama-2011-451.pdf

[10] Video de Webinar: Revolutionizing Renal Care with Predictive Analytics for CKD, Viewics [acesso sob registro grátis]

https://viewics.com/resources/revolutionizing-renal-care-with-predictive-analytics-for-ckd/

[11] Big Read: What does Google DeepMind want with the NHS?, Digital Health, 20.mar.2017

https://www.digitalhealth.net/2017/03/deepmind-mustafa-suleyman-interview/

[12] Using data analytics to improve diabetes Prevention, Big Data Made Simple, 15.mar.2015

http://bigdata-madesimple.com/using-data-analytics-to-improve-diabetes-prevention/

[13] Deep Learning Brasil, UFG

http://www.deeplearningbrasil.com.br/

[13.1] Recurrent neural network, Wikipedia

https://en.wikipedia.org/wiki/Recurrent_neural_network

[14] Dzmitry Bahdanau, Kyunghyun Cho e Yoshua Bengio. “Neural Machine

Translation by Jointly Learning to Align and Translate”. Em:

CoRR abs/1409.0473 (2014)

http://arxiv.org/abs/1409.0473

[14.1] Microbiota, Wkipedia

https://en.wikipedia.org/wiki/Microbiota

[15] Vídeo: Jessica Mega, PhD MD (Verily Google CEO), Stanford Medicine Big Data, Precision Health, May 2017

https://www.youtube.com/watch?time_continue=779&v=e5U80JrN-rk

[16] Vídeo: Calum MacRae, PhD MD (Harvard Medical School), Stanford Medicine Big Data, Precision Health, May 2017

https://www.youtube.com/watch?time_continue=1&v=d_OT_r7NZAY

[17] Big Data and Genomics, Huffington Post, 13.sep.2017

http://www.huffingtonpost.com/entry/big-data-and-genomics_us_59b8fac8e4b02c642e4a12a4

[18] Artificial intelligence in Healthcare: Big data and invisible patients, MedCityNews, 27.aug.2017

https://medcitynews.com/2017/08/artificial-intelligence-big-data-invisible-patients/

[19] Cognitive health care in 2027, Deloitte Insights, 12.sep.2017

https://dupress.deloitte.com/dup-us-en/focus/cognitive-technologies/cognitive-health-care-in-2027.html

Emitido por Eduardo Prado

Data: 17.set.2017

[*] Autores:

1.Anderson Soares

Anderson da Silva Soares (www.inf.ufg.br/~anderson), professor e pesquisador de Machine Learning e Deep Learning na Universidade Federal de Goiás. Fundador da comunidade Deep Learning Brasil (www.deeplearningbrasil.com.br), possui doutorado em Engenharia Eletrônica e Computação pelo Instituto Tecnológico de Aeronáutica (ITA).

2.Rafael Sousa

Rafael Teixeira Sousa: professor na Universidade Federal de Mato Grosso, possui mestrado em Ciência da Computação na área de Reconhecimento de Padrões pela Universidade Federal de Goiás (UFG) e atualmente é aluno do programa de Doutorado em Ciência da Computação da UFG.

3.Eduardo Prado

Eduardo Prado é consultor de mercado em novos negócios, inovação inteligência artificial e tendências em Mobilidade e “Big Data” em Saúde e Indústria.

E-mail: eprado.sc@gmail.com

Twitter: https://twitter.com/eprado_melo

Outras matérias de Eduardo Prado:

1.Convergência Digital

http://convergenciadigital.uol.com.br/cgi/cgilua.exe/sys/start.htm?sid=37

2.Blog Saúde 3.0

http://saudebusiness.com/blogs/saude-3-0/

Análise preditiva de complicações em pacientes diabéticos

Um tópico muito importante atualmente na saúde é a Medicina Preditiva que é um campo da medicina que tem como objetivo prever a probabilidade de uma doença e instituir medidas preventivas para prevenir ou diminuir seu impacto sobre o paciente.