Prévia do material em texto
1/3 A poderosa abordagem diagnóstica usa a luz para detectar praticamente todas as formas de câncer Usando a espectroscopia Raman como um meio de detecção, os pesquisadores construíram um extenso banco de dados de assinaturas para detectar qualquer câncer. Se o câncer é detectado cedo o suficiente, as chances de sobrevivência melhoram drasticamente. Infelizmente, os métodos tradicionais de triagem, como endoscopia ou biópsias, de tecido suspeito identificam cânceres que estão a caminho de se tornarem problemáticos, sem mencionar que esses métodos também são invasivos e complicados de realizar. Técnicas que rastreiam fluidos corporais usando lasers, como a espectroscopia Raman aprimorada pela superfície (SERS), mostram promessa porque são mais rápidas e menos invasivas. Os pesquisadores podem detectar com precisão quantidades minúsculas de moléculas biológicas, por exemplo aquelas associadas ao câncer em estágio inicial, em uma amostra de sangue fácil de entender. Embora os pesquisadores estejam otimistas sobre a capacidade dessas técnicas de fornecer detecção precoce, os problemas permanecem, especialmente quando se lida com formas raras de câncer Esses casos raros não produzem os mesmos resultados quando se utilizam técnicas, como SERS, e muitas vezes são perdidos por modelos e algoritmos. Em um artigo publicado na Advanced Intelligent Systems, o professor Duo Lin no Laboratório Provincial de Tecnologia Fotônica da Fujian, na Universidade Normal de Fujian, e seus colegas descrevem uma solução criativa para detectar formas raras da doença. 2/3 Transformando luz em diagnóstico de câncer O desafio com o SERS é que, ao contrário de outros exames médicos em que uma amostra física pode ser examinada, o SERS revela uma mudança na energia dos fótons de luz que passaram por uma amostra. Como os fótons de um laser entram em contato com as moléculas da amostra, eles se dispersam. Traduzir esse padrão de dispersão para um diagnóstico de câncer e, além disso, que tipo de câncer poderia ser, é quase impossível para os seres humanos, porque requer que um perfil de dispersão provavelmente associado ao câncer seja ajustado pelo rastreamento de milhares de amostras cada uma com diferenças sutis. Felizmente, esse é o tipo de problema em que um algoritmo bem treinado se destaca. Para levar o algoritmo até a velocidade, os pesquisadores têm usado um grande número de amostras conhecidas, positivas e negativas para o câncer, como um conjunto de dados de treinamento que permite ao algoritmo aprender quais características distinguem positivo e negativo. Após catalogar e categorizar as diferenças sutis, surge um modelo para diagnosticar o câncer. O modelo funciona muito bem para cânceres comuns, pois há muito material de treinamento, mas por sua própria natureza, os cânceres raros estão representados no banco de dados de treinamento e difíceis para o algoritmo aprender e detectar. Aprendendo com a prevalência do câncer no mundo real Para resolver esse desequilíbrio de dados, havia várias estratégias de amostragem disponíveis para Lin e sua equipe que aumentam artificialmente a representação de pontos de dados raros, neste caso cânceres raros. Eles escolheram uma estratégia chamada Técnica de Sobre-Sampling de Minoridade Sintética (SMOTE). “Geralmente, o SMOTE é uma técnica minoritária de sobreamostragem, o que aumenta o número de amostras de classe minoritária, sintetizando novas amostras entre os vizinhos mais próximos, aliviando assim o problema do desequilíbrio de dados”, explicou Lin. Para aumentar o tamanho da amostra de cânceres raros, Lin usou SMOTE para escolher aleatoriamente amostras que são os vizinhos mais próximos dos raros cânceres – em outras palavras, amostras que são semelhantes. SMOTE, em seguida, cria artificialmente uma nova amostra entre os dois. Mas o SMOTE sozinho não estava resolvendo o problema. “Descobrimos que, quando o número de classes minoritárias era tanto quanto as classes majoritárias, o modelo sofria com a redundância de dados, levando a um fraco desempenho de classificação”, disse Lin. Não foi até Lin e seu colega da Universidade Normal de Fujian, Shangyuan Feng, fez uma observação fundamental sobre a distribuição de câncer raro na população que a solução ficou clara. Eles viram que a prevalência de câncer na população segue aproximadamente o que é conhecido como uma distribuição de leis de poder. 3/3 Simplificando, esta é uma relação estatística entre duas quantidades em que uma mudança relativa em uma resulta em uma mudança relativa proporcional na outra. Com esse conhecimento, eles poderiam ajustar a quantidade de reamostragem que o SMOTE estava fazendo nos raros cânceres para se adequar a essa relação do mundo real e criar um conjunto de dados equilibrado. De acordo com Lin, “os experimentos mostram que o método de poder legal-SMOTE pode efetivamente aliviar o problema de desequilíbrio de dados e melhorar o desempenho do modelo”. O poder da estatística Tendo superado esse obstáculo, a equipe está ampliando o número de amostras e tipos de câncer em seus conjuntos de dados de treinamento e espera que o modelo se mantenha diante de mais e mais dados. Se isso acontecer, uma nova técnica de diagnóstico poderosa poderia melhorar o prognóstico de pacientes afligidos por todas as formas de câncer. Curiosamente, as distribuições de leis de energia são encontradas em muitos conjuntos de dados e Lin acredita que seu método também pode ser aplicado aqui. “Na verdade, as distribuições de lei de energia ou cauda longa são encontradas em muitos cenários, como fraude de telecomunicações, detecção de anomalias, detecção de intrusão de rede, previsão de desastres, etc.” Referência: Changbin Pan, et al., SMOTE baseado em Power-Law na superfície sérica desequilibrada, aumentou os dados de espectroscopia Raman para o rastreamento do câncer, Sistemas Inteligentes Avançados (2023). DOI: aisy.202300006 Crédito da imagem: Ivan Evans em Unsplash ASN WeeklyTradução Inscreva-se para receber nossa newsletter semanal e receba as últimas notícias científicas diretamente na sua caixa de entrada. ASN WeeklyTradução Inscreva-se no nosso boletim informativo semanal e receba as últimas notícias científicas. https://onlinelibrary.wiley.com/doi/full/10.1002/aisy.202300006 https://onlinelibrary.wiley.com/doi/full/10.1002/aisy.202300006