Treine, teste, preveja: utilização de big data e machine learning em psiquiatria

A introdução de biomarcadores para diagnóstico e tratamento de doenças psiquiátricas na prática clínica de rotina requer a mudança de estudos de prova de conceito, para validação e implantação clínica em larga escala. Ao envolver médicos, a tecnologia de machine learning (ML) e as iniciativas de Big Data ajudarão a fornecer modelos de alta qualidade para uso clínico. Os desenvolvimentos animadores neste campo foram apresentados no Congresso do Colégio Europeu de Neuropsicofarmacologia (ECNP2018).

Para mais informações sobre Big Data em psiquiatria e neurologia, consulte “Big Data in Healthcare” no Campus do Lundbeck Institute.

A Dra. Janaína Mourão-Miranda (University College London, Reino Unido) abordou o questionamento: "Como podemos combinar técnicas de machine learning e neuroimagem para melhorar o diagnóstico e os resultados em psiquiatria?”

Como podemos combinar técnicas de machine learning e neuroimagem para melhorar o diagnóstico e os resultados em psiquiatria?

Treine, teste, preveja

Uma estrutura de componentes de treinamento e de teste, com imagens cerebrais de pacientes e controles saudáveis, é utilizada para treinar o algoritmo de ML de modo a desenvolver a função preditiva. O algoritmo é, em seguida, aplicado para testar imagens para predizer  paciente vs. controle saudável.

Essa técnica foi aplicada extensivamente para muitas questões clínicas em psiquiatria, incluindo a identificação de indivíduos em risco de desenvolver uma condição ou resposta ao tratamento e a previsão do resultado da doença. Um dos principais problemas enfrentados no desenvolvimento dessa tecnologia em uma escala maior, no entanto, é a reprodutibilidade. O aumento do tamanho da amostra parece diminuir a precisão, pela limitação da natureza binária da classificação categórica dos participantes/dados. Uma ampla gama de avaliações clínicas é condensada em um único rótulo, assumindo homogeneidade dentro do grupo, enquanto os grupos do mundo real são muito heterogêneos. Portanto, o benefício da utilização de medidas clínicas contínuas. 

Nos modelos de regressão, as imagens recebem uma pontuação em substituição à classificação binária e, nos modelos normativos, o algoritmo é treinado para detectar discrepâncias.

Várias fontes são melhores que uma

Esse modelo ainda é limitado pelo uso insuficiente de muitas das informações clínicas disponíveis. A aprendizagem de várias fontes utiliza diversas modalidades de dados. O que é útil na identificação de biomarcadores, porém ainda é limitado a uma pontuação que pode não capturar todas as informações necessárias.

Os modelos de estratificação são mais transformadores, identificando subgrupos com riscos específicos ou padrões de resposta. A determinação de um ‘espaço latente de comportamento cerebral’ permite a identificação de indivíduos que estão passando de um estado ‘saudável’ para uma ‘doença’, baseada na expressão de determinadas associações, com potencial de direcionar a intervenção precoce.

A aplicação à prática clínica requer a mudança de dados para inferência em nível de grupo para modelagem preditiva

O que é um bom modelo preditivo?

A aplicação à prática clínica requer a mudança de dados para inferência em nível de grupo para modelagem preditiva1. O professor Tim Hahn (Goethe-University Frankfurt, Alemanha) propôs diretrizes para avaliar o que é um bom modelo preditivo. Como médicos ou pesquisadores podem julgar a qualidade da explosão de artigos sobre inteligência artificial (IA)/ML e avaliar a utilidade clínica e o potencial translacional? Conforme dito por John Naisbitt: “Estamos imersos em informações, porém famintos por conhecimento”2.

“Estamos imersos em informações, porém famintos por conhecimento”

Apresentando a Transparência da IA

Para ajudar os médicos, ele propôs uma estrutura conceitual de “Transparência da IA” analisando a generalização, o escopo do modelo e o perfil de risco. Não é necessário entender o próprio algoritmo esta lista de verificação de práticas recomendadas é fácil de usar.

O modelo é capaz de generalização quando aplicado a dados não vistos anteriormente? É importante manter os dados de treinamento e de teste independentes; caso contrário, o modelo ficará muito bom na descrição dos dados de treinamento, mas não poderá ser aplicado aos dados de teste. O professor Hahn incentivou a utilização de repositórios online, onde os pesquisadores podem carregar os dados e receber previsões de retorno3. Caso os conjuntos de dados não possam ser mantidos independentes, é importante fazer a validação cruzada, especialmente para a otimização de hiperparâmetros, reconhecendo o equilíbrio entre viés e variação.

É importante manter os dados de treinamento e de teste independentes

O segundo elemento é o escopo do modelo.  Um modelo só pode fazer previsões de alta qualidade sobre as pessoas suficientemente representadas no conjunto de treinamento. Ele também precisa de avaliação no contexto de seu uso posterior.  O ideal é não ter critérios de exclusão em estudos; caso contrário, será difícil demonstrar que o modelo funciona em ambientes da vida real.

O modelo pode fornecer informações além daquilo que já é conhecido?

O importante elemento final é a avaliação do perfil de risco e da distribuição de erros. O modelo pode fornecer informações além daquilo que já é conhecido (utilidade incremental)? Existe viés algorítmico? Um modelo aprenderá aquilo que é ensinado e há potencial para introduzir viés, mesmo que não intencional. Esteja ciente dos problemas de segurança, com a necessidade de proteger os dados de treinamento e de executar ataques adversos para imunizar modelos.  Quando isso ocorrer, o próximo passo será resolver as questões de compliance.

Referências

  1. Hahn et al. Mol Psychiatry 2017;22(1):37-43
  2. Megatrends: Ten New Directions Transforming Our Lives. Warner Books, 1982
  3. https://photo-ai.com/repro