Perché è improbabile che Atlas e Comet vincano la guerra dei browser AI

Se qualcuno mi avesse chiesto un anno fa quale potrebbe essere la prossima grande innovazione che uscirà dalle principali aziende di intelligenza artificiale, sono abbastanza sicuro che non avrei detto “un browser”.
Ma questo è esattamente ciò che hanno fatto sia OpenAI che Perplexity, lanciando ciascuno i propri nuovi browser abilitati all’intelligenza artificiale, rispettivamente Atlas e Comet.
Se leggi le comunicazioni PR o guardi le demo del lancio, entrambe le società inquadrano i loro nuovi browser come il primo passo verso un rimodellamento completo del modo in cui i consumatori abituali utilizzano Internet. In Il live streaming di OpenAI Per lanciare Atlas, Sam Altman ha affermato che “l’intelligenza artificiale rappresenta una rara opportunità ogni decennio per ripensare a ciò che può essere un browser”.
Avanti Sottostackil CEO delle applicazioni di OpenAI, Fidji Simo, ha scritto di Atlas e ChatGPT “che si stanno evolvendo per diventare il sistema operativo per la tua vita”.
Il CEO di Perplexity Aravind Srinivas ha usato un linguaggio simile, descrivendo Comet come un “sistema operativo cognitivo“, mentre Jesse Dwyer, che ha lavorato su Comet, è ampiamente citato riferendosi al browser come “sistema operativo della tua mente.”
Tutto ciò sembra estremamente trasformativo. Ma proprio non lo vedo. Almeno non ancora.
Anche se queste frasi avrebbero potuto avere un buon riscontro nei focus group, in realtà sono prive di significato. Un browser non è un sistema operativo esattamente nello stesso modo in cui non lo sono ChatGPT o Perplexity.
Chrome, Edge e Safari sono ciascuno collegati a un’enorme suite di prodotti e strumenti digitali incentrati su un diverso sistema operativo. Anche se è vero che chiunque può installare e utilizzare uno qualsiasi di questi browser, è proprio la profonda integrazione con una suite completa di strumenti proprietari a creare ecosistemi e flussi di lavoro.
Potrebbe essere che, nella loro folle corsa per trovare modelli di monetizzazione sostenibili, OpenAI e Perplexity siano entrambi caduti vittime del pregiudizio della sopravvivenza?
Cosa possono imparare le aziende tecnologiche dai bombardieri della Seconda Guerra Mondiale
Durante la seconda guerra mondiale, l’esercito americano incaricò il gruppo di ricerca statistica della Columbia University di risolvere un problema urgente: troppi bombardieri americani non tornavano dalle missioni sull’Europa. Gli esami dell’aereo che è riuscito a tornare indietro hanno rivelato la struttura dei danni, con fori di proiettile fortemente concentrati sulla fusoliera e sulle ali. La conclusione ovvia sembrava essere quella di rinforzare le aree gravemente danneggiate.
Ma matematico Abraham Wald vedeva il problema in modo diverso. Si rese conto che i militari stavano guardando solo gli aerei sopravvissuti. Non importa quanto un aereo potesse essere colpito, sarebbe potuto tornare alla base solo se nessuno di quei colpi fosse stato critico. E gli aerei che non sono tornati?
Lungi dall’esporre punti deboli da rinforzare, i fori dei proiettili rivelavano dove era possibile sopravvivere al danno. Certamente non hanno rivelato quali aree fossero decisive nel determinare il successo o la sopravvivenza di un bombardiere.
Questo è forse l’esempio più famoso di pregiudizio alla sopravvivenza: ci concentriamo erroneamente sui tratti comuni di coloro che hanno avuto successo (o sono sopravvissuti) ignorando i molti altri che hanno fallito, portando a false conclusioni su quali aspetti abbiano realmente contribuito a quel successo.
Il pregiudizio della sopravvivenza è ovunque intorno a noi. Gli articoli citano gli abbandoni universitari come Bill Gates e Mark Zuckerberg come prova del fatto che i titoli di studio non contano, ignorando opportunamente il vasto numero di abbandoni che non sono miliardari. Innumerevoli libri di auto-aiuto promettono di sbloccare la formula per fama e fortuna documentando le abitudini delle persone di successo – svegliarsi alle 5 del mattino, meditare ogni giorno, fare docce fredde – ignorando i milioni di persone che seguono routine simili e non ce la fanno mai.
Allo stesso modo, Perplexity e OpenAI sembrano aver esaminato i giganti della tecnologia di successo che sperano di emulare un giorno – Google, Microsoft e Apple – e hanno deciso che un fattore comune per il loro continuo successo è che ciascuno di loro ha un browser proprietario.
Quando l’imitazione assomiglia all’intuizione, ma non lo è
L’anno scorso, quando apparve brevemente che le autorità di regolamentazione avrebbero potuto imporre rimedi strutturali a Google, compreso il disinvestimento, sia OpenAI che Perplexity hanno espresso serio interesse nell’acquisto del browser Chrome. La perplessità è arrivata addirittura a fare un’offerta non richiesta 34,5 miliardi di dollari.
Sfortunatamente per loro, anche se il giudice ha imposto sanzioni e altre restrizioni a Google, non ha imposto una vendita forzata di Chrome.
Quindi, non dovrebbe sorprendere che sia Atlas che Comet sembrino estremamente familiari, soprattutto perché erano entrambi in fase di sviluppo mentre il caso antitrust di Google si svolgeva in tribunale. Questo è il piano B. Se non puoi acquistare il browser, copialo.
OpenAI e Perplexity hanno esaminato l’esperienza utente consolidata di Chrome, con la barra degli indirizzi unificata, le schede, le estensioni e altro ancora, e l’hanno replicata tutta. Entrambi i browser sono addirittura basati su Chromium, la tecnologia open source che guida Chrome.
D’altra parte, lo stesso ha fatto Microsoft durante la creazione di Edge. E sebbene Safari e Firefox non siano basati su Chromium, hanno adottato molte delle funzionalità rese popolari per la prima volta da Chrome.
Naturalmente, sia OpenAI che Perplexity hanno ciascuno stratificato la propria salsa segreta AI oltre ai soliti campanelli e fischietti. Entrambi i browser sono progettati per supportare la “navigazione agente”, gestendo tutto quel clic apparentemente noioso e leggendo cose per tuo conto. (Chiamatemi vecchio stile, ma mi piace navigare sul web. Mi piace navigare, scoprire e imbattermi in cose. Mi piace leggere un articolo ben scritto molto più di un breve riassunto dei punti chiave.)
La navigazione agentica può persino trovare e prenotare vacanze, gestire la tua posta elettronica e completare i tuoi acquisti, il tutto mentre fai qualcos’altro.
Il fatto è che abbiamo già un’intelligenza artificiale agente. Molto di ciò che questi nuovi browser possono fare accade già quando usi ChatGPT o Perplexity. È solo che in precedenza è successo dietro le quinte.
Quando digiti una query o un prompt, LLM utilizza il suo browser headless per effettuare ricerche sul Web e trovare le informazioni necessarie per generare una risposta accurata. Questi nuovi browser ad agenti rendono visibile quel processo precedentemente nascosto. Puoi osservare come il browser, ad esempio, ristruttura i dati in un foglio di calcolo o salta da una pagina all’altra sul sito web di un supermercato, aggiungendo articoli al carrello pronti per il check-out.
O, più probabilmente, farai qualcos’altro in un’altra scheda o finestra finché il browser non ti avviserà che l’attività è completata, perché chi ha bisogno di vedere la preparazione della salsiccia?
Misurazioni, frodi e problemi di sicurezza
Le aziende di intelligenza artificiale sperano chiaramente che la promessa della navigazione tramite agenti attiri le persone verso Atlas o Comet. Tuttavia, è probabile che crei non pochi grattacapi alle organizzazioni.
Mentre il browser headless di un LLM potrebbe identificarsi, ad esempio, come PerplexityBot quando visita il tuo sito web, lo stesso non è vero quando il browser Comet di Perplexity visita il tuo sito per conto di un utente. Al tuo strumento di analisi, probabilmente assomiglia a qualsiasi altro browser Chromium, completo di indirizzo IP del visitatore. In altre parole, probabilmente non sarai in grado di capire se si tratta di un browser umano o di un agente che visita il tuo sito.
COME Digiday sottolinea, questo crea un sacco di problemi per gli esperti di marketing e i SEO. Innanzitutto, le tue solite metriche relative al traffico e ai clic diventano meno affidabili. Se non puoi misurarlo, non puoi gestirlo.
Poi c’è il rischio di massicce frodi pubblicitarie. Se gli annunci vengono offerti agli agenti IA invece che agli esseri umani, chi può saperlo? E con gli agenti IA capaci di migliaia di richieste al secondo, le cose potrebbero diventare davvero spaventose.
E poi ci sono le implicazioni sulla sicurezza.
Questi nuovi browser ad agenti introducono nuovi rischi significativi per la sicurezza. Gartner lo ha consigliato che le aziende bloccano tutti i browser IA per motivi di sicurezza informatica, citando in particolare la pronta iniezione come uno dei rischi principali.
L’anno scorso, LayerX Security ha coniato il termine CometaJacking per descrivere una di queste tecniche. Facendo semplicemente clic su un collegamento dannoso, l’utente attiva comandi nascosti che ordinano all’intelligenza artificiale di Comet di accedere e rubare tutti i dati sensibili esposti nel browser. Gli hacker non hanno bisogno di phishing per password o altre credenziali perché il browser ha già autorizzato l’accesso a tutto.
Solo tre settimane dopo, LayerX ha scoperto a vulnerabilità in Atlas che potrebbe anche essere sfruttato da malintenzionati per iniettare istruzioni dannose nella memoria di ChatGPT.
In questo momento, chiedere a uno di questi browser di prenotare biglietti, completare transazioni o modificare documenti importanti per mio conto sembra meno come ricevere aiuto da un assistente fidato e più come consegnare le chiavi a un perfetto sconosciuto.
Quale problema risolvono effettivamente questi nuovi browser?
Ma ciò non significa che questi nuovi browser ad agenti non avranno un posto. Sebbene l’adozione mainstream sembri improbabile, alcuni team digitali potrebbero comunque trovare un valore reale lavorando con questi browser ad agenti.
Non importa i laboriosi test manuali. Gli sviluppatori e i tester UX potrebbero utilizzare questi browser per simulare i percorsi degli utenti su larga scala, testando il modo in cui i siti Web rispondono in diversi scenari in modo molto più efficiente.
I professionisti SEO potrebbero usarli per capire come gli agenti AI interpretano la struttura del sito e le pagine web, fornendo indizi su come il browser headless nascosto di LLM “vede” i tuoi contenuti ed evidenziando dove potrebbero essere apportati miglioramenti per migliorare la visibilità.
E per gli utenti tecnici che sono a proprio agio con i rischi per la sicurezza, non c’è dubbio che i browser agenti offrono un’automazione davvero utile per attività ripetitive, come l’estrazione di dati da più fonti in fogli di calcolo o il monitoraggio di siti Web specifici per eventuali modifiche.
L’ironia è, ovviamente, che questi utenti esperti e sviluppatori sono completamente il pubblico sbagliato se OpenAI e Perplexity sperano di acquisire una gran quantità di preziosi dati utente per addestrare ulteriormente i loro modelli. Hanno bisogno di dati sui modelli tipici di comportamento dei consumatori, non dei flussi di lavoro di test degli sviluppatori.
Se Atlas e Comet vogliono avere qualche possibilità di differenziarsi dagli operatori storici di Chrome, Safari, Edge, Firefox e altri, devono offrire una proposta di valore chiara, attraente e significativa al consumatore medio; idealmente, uno che non sia irto di rischi. Ma poiché anche i principali browser hanno iniziato a integrarsi gradualmente con l’intelligenza artificiale, questa proposta è tutt’altro che chiara e qualsiasi differenziazione sarà probabilmente di breve durata.
Se l’intelligenza artificiale trasformerà il modo in cui la maggior parte delle persone naviga e interagisce con Internet, non sarà grazie ad Atlas o Comet. Più probabilmente, sarà a causa di Cromo o forse Edge. Non solo questi browser hanno già il potere come operatori storici di lunga data, ma sia Google che Microsoft hanno anche i propri LLM proprietari estremamente potenti.
Potrebbe valere la pena guardare anche Firefox, poiché viene lanciato di nuovo Controlli dell’intelligenza artificiale progettato per offrire agli utenti un controllo molto maggiore su quali funzionalità AI desiderano utilizzare o bloccare. L’approccio di Firefox potrebbe darci il quadro più chiaro finora del tipo di esperienze basate sull’intelligenza artificiale che gli utenti vogliono davvero vedere, invece di ciò che le aziende di intelligenza artificiale preferirebbero.
La “guerra dei browser AI” è appena iniziata e non credo che sarà breve. Non si tratterà di un rapido sconvolgimento, non importa quanto OpenAI e Perplexity vorrebbero in qualche modo saltare decenni di posizione dominante e fiducia con alcune demo appariscenti e un mucchio di previsioni ottimistiche. Invece, i vincitori saranno coloro che si concentreranno sull’esperienza dell’utente e su quell’importantissima proposta di valore sopra ogni altra cosa. Qualunque sia la forma che l’intelligenza artificiale o la navigazione tramite agenti prenderanno alla fine, sapremo che la guerra sarà finita quando scomparirà così completamente nei flussi di lavoro delle persone che nessuno ci penserà più.
Ulteriori risorse:
Immagine in primo piano: Chi è Danny/Shutterstock



