Telefone/Ramal: | (98) 2016-8166/8942 |
Um Olhar não Supervisionado Sobre o Desempenho dos Participantes Maranhenses no ENEM 2023.
Ciência de Dados. Mineração de Dados Educacionais. Regras de
Associação. Enem. Maranhão.
A Ciência de Dados é uma área interdisciplinar, que pode colaborar para o enfrentamento dos
desafios da humanidade para o século XXI, dentre eles a busca por uma Educação inclusiva,
equitativa e de qualidade, sobretudo na realidade brasileira, em que o analfabetismo ainda
atinge milhões de pessoas, de forma mais severa, os negros da Região Nordeste. O Exame
Nacional do Ensino Médio (Enem) tem desempenhado importante papel para a avaliação da
educação básica brasileira, bem como, servido como a principal porta de acesso à educação
superior. Por outro lado, os resultados apresentados pelos estudantes brasileiros,
especialmente no Estado do Maranhão, servem de alerta e apontam para a necessidade de
melhorias na educação básica. O estudo justifica-se pelos resultados do Maranhão no Ideb e
no Enem, colocando-o, nesta última, entre os piores resultados médios do país na edição de
2023. A problemática do estudo reside na compreensão das variáveis que assumem papel
preponderante para o desempenho dos estudantes maranhenses na mais importante avaliação
da educação básica, sob a perspectiva da mineração de dados educacionais. Por essa razão, o
objetivo geral consiste em investigar os fatores influentes no desempenho dos estudantes
maranhenses no Enem 2023, partindo das ferramentas estatísticas de análise exploratória e
extraindo conhecimentos por meio da aprendizagem de máquina não supervisionada, de
forma específica, a extração de regras de associação com o algoritmo FP-Growth. A
metodologia empregou o processo CRISP-DM de descoberta de conhecimento em bases de
dados. Os experimentos computacionais contemplaram a seleção de dez atributos por meio da
aplicação da RFE combinada ao algoritmo Random Forest, bem como, a posterior aplicação
do algoritmo FP-Growth em dez ensaios/configurações, sobre o subconjunto de microdados
dos participantes maranhenses no Enem 2023. O estudo identificou outra variável relevante
para o desempenho dos participantes, que favorece uma melhor compreensão e caracterização
socioeconômica do público maranhense, a citar a natureza da ocupação do pai ou homem
responsável. Além disso, conseguiu revelar padrões subjacentes aos dados, não vislumbrados
na análise exploratória, como a descoberta de grupos afetados de forma cumulativa por
diferentes atributos. Por exemplo, o baixo desempenho condicionado pela escolaridade e
natureza da ocupação do pai, ou ainda, a caracterização do perfil socioeconômico dos
participantes maranhenses a partir das variáveis selecionadas, com alto índice de confiança.
Apesar de limitações inerentes à qualidade da base de dados, o estudo mostrou-se relevante
socialmente e com potencial de replicabilidade para outras regiões.