Campos aleatórios condicionais na segmentação de textos por idioma

Autores

DOI:

https://doi.org/10.18046/syt.v15i43.2712

Palavras-chave:

Segmentação de textos por idiomas, campos aleatórios condicionais.

Resumo

 Neste artigo, é proposto o uso de campos condicionais aleatórios para a resolução da tarefa de segmentação de textos por idioma, considerando-a como uma tarefa de marcação de sequências. A metodologia considera que a mudança entre um idioma e outro nos documentos ocorrerá em qualquer parte do texto e pressupõe que as observações no sistema serão dadas pelas palavras no texto e que os estados serão os diferentes idiomas. Conforme os resultados da pesquisa, conclui-se que os campos aleatórios condicionais são uma ferramenta muito poderosa para a segmentação de textos multilíngues.

 

Biografia do Autor

  • Robin Cabeza Ruiz, University of Holguín

    Master in Design Assisted by Computer from the Universidad de Holguín (Cuba, 2015) with a bachelor’s degree in Computer Science from Universidad de Oriente (Cuba, 2017). Currently he is professor of informatics II and member of CAD/CAM Studies Center at the Faculty of Engineering at the Universidad de Holguín. His main areas of interest in research are biomechanical and text segmentation by computer. 

Downloads

Publicado

2017-12-06

Edição

Seção

Discussion papers