Resumo: Novos conteúdos de mı́dia são produzidos todos os dias: vı́deos na internet, programas de televisão, anúncios, entre outros. Porém, esses conteúdos não são avaliados e organizados de forma adequada, pois essa tarefa, quando feito por humanos, é repetitivo e demorado. Dado esse problema, este trabalho propõe um modelo computacional capaz de descrever automaticamente um vı́deo. É esperado que a conversão automática de mı́dia em um curto texto resulte em acesso rápido de informações para todos os usuários, sem demandar custo humano para isso.Há pesquisas relacionadas que propõe esta tarefa para imagens, porém, elas raramente abrangem vı́deos, e geralmente são feitas em inglês, o que afeta a possibilidade de utilização deste sistema no Brasil. Por isso, nesta monografia as descrições são produzidas em Português para contribuir com a acessibilidade de informações para os falantes de português brasileiro. A implementação é feita em três etapas: seleção de imagens do vı́deo, processamento de imagens selecionadas e geração de frases. Os resultados obtidos foram razoáveis, tendo um desempenho melhor para imagens que aparentam estaticidade e pior para as que contém objetos em movimento.
Banca:
Flávio Luis de Mello, DSc. (Presidente)
Heraldo Luis Silveira de Almeida, DSc (Examinador)
Diego Leonel Cadette Dutra, DSc. (Examinador)