Random Forest Training Acceleration through HW-SW co-design techniques

Docente

Marco Santambrogio (marco DOT santambrogio AT polimi DOT it)

Referente del progetto

Alessandro Verosimile (alessandro DOT verosimile AT polimi DOT it)

Keywords

Random Forests, Machine Learning, FPGA, HW-SW co-design

Descrizione

L’addestramento di modelli Random Forest rappresenta ancora oggi un collo di bottiglia computazionale, specialmente in scenari embedded o distribuiti, a causa della valutazione massiva di possibili split e della gestione iterativa di grandi volumi di dati. L’accelerazione hardware su FPGA è stata dimostrata efficace nel ridurre la latenza e migliorare l’efficienza energetica del training mediante parallelizzazione fine-grained e ottimizzazione dell’accesso alla memoria [1]. Parallelamente, in contesti distribuiti come il federated learning, l’addestramento di modelli tree-based introduce ulteriori sfide legate alla comunicazione e alla sincronizzazione tra nodi, per cui strategie speculative e ottimizzazioni strutturali del training risultano fondamentali [2]. Il progetto proposto mira allo sviluppo di una piattaforma di accelerazione embedded su FPGA del training di Random Forest e, opzionalmente, sue varianti avanzate, includendo modelli con split obliqui (basati su combinazioni lineari di feature) e split non lineari. L’obiettivo centrale è definire metodologie di co-design algoritmo–architettura, in cui la struttura del modello venga ripensata in funzione delle caratteristiche dell’hardware riconfigurabile e, viceversa, l’architettura FPGA venga specializzata per le primitive computazionali dominanti nel training (calcolo di impurità, selezione degli split, aggiornamento degli istogrammi, valutazione di iperpiani).