Inizio

01/12/2023

Fine

31/03/2026

Status

In corso

LEPCO-EX2 - Learning-based Model Predictive Control by Exploration and Exploitation in Uncertain Environments

Inizio

01/12/2023

Fine

31/03/2026

Status

In corso

LEPCO-EX2 - Learning-based Model Predictive Control by Exploration and Exploitation in Uncertain Environments

Questo progetto sviluppa un quadro metodologico per l’apprendimento e il controllo simultanei di sistemi dinamici, in grado di gestire dinamiche o ambienti incerti e tempo-varianti all’interno di un framework di controllo a orizzonte mobile. Le strategie proposte integrano azioni di apprendimento attivo per sfruttare le informazioni sul processo generate online durante il funzionamento ottimale in anello chiuso, senza creare artificialmente condizioni informative e senza svolgere esperimenti di identificazione del sistema indipendenti o forzati durante l’operazione.

Una delle applicazioni considerate è il Controllo Attivo del Rumore (Active Noise Control, ANC) in ambienti tempo-varianti. In questo contesto, a partire da un modello parzialmente noto dell’ambiente, la politica di controllo deve apprendere il modello di propagazione delle onde in spazi in evoluzione, bilanciando la cancellazione del rumore e la generazione di informazioni sul comportamento del sistema.

Considerata la difficoltà di misurare preventivamente la pressione acustica per applicare i metodi ANC classici, strumenti di intelligenza artificiale come gli algoritmi di deep learning possono fornire un approccio efficace basato sui dati. Essi possono essere impiegati per calcolare o predire la pressione acustica grazie alla loro capacità di catturare pattern spazialmente coerenti nei campi di pressione acustica irradiata. In particolare, questo progetto sviluppa implementazioni in tempo reale di algoritmi di controllo predittivo (Model Predictive Control, MPC) basati su deep learning su hardware modulare dedicato presso il Laboratorio di Suono e Vibrazioni del PoliMi.

Pubblicazioni

Y. He, H.R. Karimi, P. Mei, Cooperative multi-agent deep reinforcement learning-based eco-driving strategy for hybrid electric vehicles at multi-intersection scenarios, Neurocomputing, 132412, (2025)

L.J. Liu, T.T. Huang, H.R. Karimi, Y.H. Ma, J. Su, Optimized traffic signal control system incorporating mixed traffic flow and adverse weather, Applied Intelligence 55 (17), 1115, (2025)

Y. Yu, H.R. Karimi, L. Gelman, J. Tian, P. Mei, A novel multi-source sensor correlation adaptive fusion framework with uncertainty quantification for intelligent fault diagnosis, Reliability Engineering & System Safety, 111812, (2025)