Manus AI: agente autonomo o solo marketing ben confezionato?

Manus è un agente AI, ovvero un sistema che agisce in autonomia senza bisogno di istruzioni continue. Secondo l’azienda sviluppatrice, The Butterfly Effect, sarebbe un passo avanti rispetto agli attuali modelli di intelligenza artificiale, con la capacità di eseguire compiti complessi, analizzare dati, prenotare voli, selezionare candidati per un lavoro e persino scrivere codice. A differenza di sistemi come ChatGPT, non aspetta input continui ma pianifica ed esegue autonomamente i task necessari per raggiungere un obiettivo.

Le demo mostrate dall’azienda evidenziano le sue capacità: Manus può analizzare curriculum, organizzare informazioni in fogli di calcolo, selezionare immobili in base a criteri prestabiliti, scrivere programmi per filtrare dati e generare report dettagliati. La sua capacità di navigare in rete, interagire con siti web e automatizzare processi lo distingue dai chatbot tradizionali.
Tuttavia, i test indipendenti sollevano diversi dubbi. I risultati ottenuti da alcuni giornalisti non sono stati all’altezza delle aspettative. In più occasioni, Manus si è bloccato, ha fornito risultati parziali o errati e ha mostrato difficoltà nell’eseguire compiti che un vero agente autonomo dovrebbe svolgere senza problemi. Per esempio, ha fallito nel prenotare un volo, non è riuscito a completare un ordine in un ristorante e ha generato link non funzionanti durante una ricerca.

Un altro aspetto da considerare è la trasparenza del progetto. L’azienda fornisce poche informazioni tecniche e non ha pubblicato documentazione dettagliata sulle tecnologie utilizzate. L’unico benchmark mostrato, che posizionerebbe Manus sopra i modelli concorrenti, proviene direttamente dall’azienda sviluppatrice, senza verifiche indipendenti. Anche il sistema di accesso alla piattaforma è limitato, con una lista d’attesa che non consente a tutti di testarlo liberamente.

L’idea di un agente AI realmente autonomo è interessante, ma la distanza tra le dichiarazioni dell’azienda e le prestazioni osservate nei test sembrano suggerire che ci sia ancora molto da migliorare. Manus mostra potenzialità, ma al momento la sua affidabilità resta un punto interrogativo.