Resumo : |
O processamento de linguagem natural é um tema que se mostra relevante desde os primeiros anos da ciência da computação moderna, quando Alan Turing propôs o desafio que recebeu o nome de Teste de Turing. Por décadas as abordagens desse tema se restringiram à modelagem do idioma através de um conjunto de regras definidas manualmente. A partir da década de 80, graças ao avanço da tecnologia de computadores e das técnicas de machinelearning, abordagens estatísticas para problemas dessa área foram encorajadas.Um dos problemas ainda não resolvidos nesse campo de estudo é a análise precisa de uma sentença quanto a sua concordância com as normas gramaticais. Este trabalho pretende propor um modelo de avaliação de texto baseado em uma abordagem estatística da linguagem. Serão propostos todos os subsistemas necessários à construção de uma aplicação capaz de avaliar um texto segundo o modelo proposto. Utilizando o mesmo conjunto de dados processados, também será construída uma aplicação que, dada uma sentença incompleta, prevê as próximas palavras mais prováveis para ela. O desempenho dessas aplicações será avaliado de forma qualitativa através de sequencias de palavras que formam ou não uma sentença na língua portuguesa. |