Detecção de Fake News em Português a partir de poucos dados rotulados
Carregando...
Data
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Catalão
Resumo
Há estudos sobre detecção de fake news há vários anos, mas a maior parte dos estudos são baseados em notícias produzidas no idioma Inglês. Este trabalho apresenta um estudo para detecção de fake news em notícias produzidas no idioma Português Brasileiro. O estudo mostra uma análise experimental do comportamento de classificadores supervisionados e semi-supervisionados capazes de predizer se uma notícia é ou não categorizada como fake news. Considerando que um conjunto de dados possui a maior parte dos dados sem rótulo de classe e que este dados podem ser ou não fake news, essas definições identificam uma nova categoria de classificadores treinados a partir de exemplos positivos e exemplos sem rótulo, ou, PU (Positive and Unlabeled) learning. Os resultados do estudo mostram que o PU learning supera outros classificadores de aprendizado supervisionado e semi-supervisionado, pois consegue identificar com eficácia mais fake news em um cenário onde se tem poucos exemplos positivos.