PYRULEANALYZER: UMA ABORDAGEM PARA O REFINAMENTO DE REGRAS DE DECISÃO EM MODELOS DE APRENDIZAGEM DE MÁQUINA BASEADOS EM ÁRVORES
Aprendizagem de Máquina; Árvore de Decisão; Floresta Aleatória; Interpretabilidade; Tempo de Inferência; Redes de Petri Coloridas; Gradient Boosting Decision Tree; Aprendizagem Federada
Modelos de aprendizagem de máquina baseados em árvores, como árvores de decisão e florestas aleatórias, são amplamente adotados em problemas de decisão devido à sua interpretabilidade intrínseca. No entanto, à medida que a precisão exigida aumenta, esses modelos tendem a crescer em complexidade, acumulando regras redundantes que comprometem tanto a auditoria humana quanto a eficiência computacional em ambientes de recursos restritos. Neste trabalho é apresentada uma abordagem para o aprimoramento desses modelos (via análise e refinamento de suas regras de decisão), focada na redução da complexidade e do tempo de inferência sem comprometer a acurácia preditiva em problemas de classificação. As duas etapas mais importantes da metodologia estão relacionadas com o uso de redes de Petri coloridas em uma etapa de prova de conceitos para a análise de regras redundantes, específicas ou incorretas e com o desenvolvimento da biblioteca pyRuleAnalyzer, que utiliza algoritmos de refinamento de regras validados formalmente na etapa anterior para eliminar redundâncias e regras de sobreajuste. Resultados preliminares em estudos de caso sobre deteção de ataques DDoS demonstraram uma redução de até 65% no número de regras e 68% na latência de inferência, mantendo aproximação com a acurácia original. A pesquisa avança agora para a realização de prova de conceito para analisar algoritmos de modelos aditivos como Gradient Boosting Decision Tree e experimentações em cenários de aprendizagem federada.