Telefone/Ramal: | (98) 2016-8166/8942 |
PROJETO DE CONTROLADOR ÓTIMO ADAPTATIVO PARA VEÍCULO AÉREO NÃO TRIPULADO – MODELO QUADRICÓPTERO – VIA PROGRAMAÇÃO DINÂMICA APROXIMADA
Controle Ótimo Adaptativo. Aprendizagem por Reforço. Programação Di-nâmica Aproximada. Controle de Quadricóptero.
Apresenta-se nesta dissertação o projeto de um controlador ótimo adaptativo para um quadri-cótpero baseado em estratégias de crítico adaptativo, usando métodos de iteração de política e iteração de valor. Esta abordagem fornece algoritmos online de controle que são integrados nas estruturas de aprendizado por reforço ator-crítico. Estas estruturas de Aprendizado por Reforço (RL), que estão inseridas no quadro de Programação Dinâmica Aproximada (ADP), são usadas para resolver problemas de decisão ótima online, sem requerer o conhecimento completo do modelo da dinâmica do sistema a ser controlado. O objetivo é implementar um controlador ótimo que atue no controle do quadricóptero, utilizando somente os sinais de entrada de con-trole, estados, bem como os custos instantâneos, observados ao longo das trajetórias do sistema. Esta técnica de projeto de controle de realimentação é capaz de sintonizar online os parâmetros do controlador na presença de variações na dinâmica da planta e perturbações externas. A ava-liação do algoritmo de controle será realizada no modelo simulado em MATLAB.