O uso de inteligência artificial (IA) para otimização de sistemas digitais se faz cada vez mais presente com o crescimento acelerado da produção de dados. Algoritmos empregados na criação desse tipo de tecnologia precisam ter a capacidade de processar grandes volumes de dados e não gerar um custo excessivo dos recursos computacionais.
Defendida no Instituto de Ciências Matemáticas e de Computação (ICMC) da USP em São Carlos, a pesquisa de doutorado Algoritmos incrementais e eficientes para árvores e regras de decisão e algoritmos baseados em proximidade colaborou para a criação de uma ferramenta que simplifica a implementação de algoritmos de aprendizado de máquina on-line.
A pesquisa tem vínculo com o Centro de Pesquisa, Inovação e Difusão do Centro de Ciências Matemáticas Aplicadas à Indústria (Cepid-CeMEAI), que promove a transmissão de tecnologias e conhecimentos científicos para o ambiente industrial.
Diferentemente do aprendizado de máquina tradicional, área de IA em que o modelo é treinado a partir de uma base de dados isolada, o aprendizado de máquina on-line é um método incremental que lida com fluxos de dados em tempo real. “Existem cenários em que você precisa tanto estar atualizado quanto atualizar seu modelo”, diz Saulo Martiello Mastelini, cientista computacional e autor da tese de doutorado.
Ferramentas de vigilância, diagnósticos médicos, transações financeiras e detecção de fraudes são casos que podem se beneficiar de sistemas que adaptam seus algoritmos conforme a inserção de novos dados. Porém, isso não vem sem custos. Saulo explica que o processamento de ambientes ricos em dados sob constante mudança é lento e utiliza alta capacidade de memória. “Talvez eu consiga rodar em um computador normal, mas em um pequeno sensor que está no meio de uma floresta e funcionando à bateria, isso pode não ser eficiente”, destaca.