De GAUDÍ a l’Apple Vision Pro

08 de Juny de 2023
Act. 22 de Novembre de 2023
Josep Maria Ganyet | VIA Empresa

Apple va presentar i no va presentar dimarts les seves esperades ulleres de realitat augmentada. Ho va fer a la conferència anual de desenvolupadors (WWDC) i va ser Tim Cook qui, un cop presentades totes les novetats, va fer servir la fórmula màgica d’Steve Jobs del “One more thing” per introduir les Apple Vision Pro. El context és important, el nom i tot el que hi vam veure també. Però és molt més interessant tot el que no hi vam veure. D’aquí la no presentació.

Vist des de fora podria semblar que Apple ha presentat unes ulleres (o un visor) de Realitat Augmentada, però no. Apple va presentar, en paraules seves, el seu primer “ordinador espacial”. Si en diem ordinador es dissipa el dubte de si dir-ne “les Vision Pro” (ulleres) o “el Vision Pro” (visor). Té sentit dir-li ordinador, ja que incorpora el potent xip M2, que és el mateix que porten els seus ordinadors de gamma alta, i el nou xip R1, que processa en temps real tots els seus sensors. El seu sistema de visualització consisteix en un parell estereoscòpic de pantalles amb una resolució superior a 4k cadascuna. Tot connectat a una bateria de petaca que garanteix una autonomia de dues hores. Disponible a principis del 2024, tindrà un preu de 3.499 dòlars.

Podria semblar que Apple ha presentat unes ulleres (o un visor) de Realitat Augmentada, però no, en paraules seves, és el seu primer “ordinador espacial”

Una de les novetats marca de la casa és una pantalla externa on normalment els visors de RV tenen una tapa de plàstic. Es fa servir per a reproduir els ulls de qui porta “l’ordinador espacial” quan detecta que algú se li acosta. Això ajuda a reduir la sensació d’aïllament de l’entorn, de l’usuari i dels qui l’envolten. Per poder fer això —i per a moltes altres funcionalitats— cal que aquest ordinador tingui informació de l’espai on es troba i és per això que porta incorporats una quantitat ingent de sensors: sis micròfons, dues càmeres frontals, dues càmeres inferiors, dues càmeres laterals, dos il·luminadors d’infrarojos, un escàner LiDAR, una càmera que detecta la profunditat i quatre càmeres d’infrarojos internes per detectar la posició dels ulls. Apple diu que ha necessitat més de 5.000 patents; el dispositiu més avançat que ha dissenyat fins ara.

L’anunci d’un nou producte d’Apple, d’un “ordinador espacial”, és pràcticament un remake d’aquella presentació de l’iPhone del 2007 quan Steve Jobs —crec que sense ser-ne del tot conscient— presentava al món, no la següent iteració del mòbil, sinó la següent iteració de l’ordinador; un ordinador que es feia més petit i més íntim. Som ara en un altre “moment iPhone”? Les similituds aparents són moltes. 

Apple diu que ha necessitat més de 5.000 patents; el dispositiu més avançat que ha dissenyat fins ara

L’iPhone al seu moment tenia un preu desproporcionat respecte a la competència. Ell llavors conseller delegat de Microsoft se’n reia del preu en una entrevista: “500 dòlars per un mòbil que no té ni teclat, deu ser el mòbil més car del món. Segur que se’n vendran molts, però nosaltres tenim el Windows Mobile que s’instal·la en un Motorola de 99 dòlars que és un dispositiu prou capaç”. Avui 8 dels 10 mòbils intel·ligents més venuts són iPhones i un mòbil d'alta gamma val entre 1.500 i 2.000 dòlars (ajusteu a inflació) i tots a fer cua. 

Tampoc no tenia aplicacions de tercers quan va sortir. Apple, que sempre ha estat molt gelosa de les seves plataformes, no permetia la instal·lació d’aplicacions de tercers al seu dispositiu. Recordo hores de furoner dedicades a fer el jailbreak (alliberar) el telèfon de la gàbia d’Apple que considerava una obligació moral. Algunes de les aplicacions pirates més exitoses i ben dissenyades van ser copiades per Apple i les va incorporar al sistema operatiu finalment. Tant va ser així que Apple va crear la seva pròpia botiga d’aplicacions: la “killer app” que l’iPhone no tenia va resultar una aplicació que et permetia baixar altres aplicacions! Una botiga d’aplicacions que va crear una indústria avui valorada en 360.000 milions de dòlars, i que va educar en el valor del programari una societat que no havia pagat mai per una aplicació (o havíeu pagat mai per un programa de Windows fins al 2007?)

Tota la munió de sensors de què he parlat abans serveixen per a molt més que per detectar quan algú se’ns aproxima i mostrar-li els nostres ulls. Serveixen també per tornar-nos a connectar amb el món físic projectant-nos el nostre entorn i això fa que el Vision Pro es pugui portar mentre ens movem per l’espai. També serveixen per poder saber on tenim i què fem amb les mans. Recordeu el Tom Cruise a Minority Report movent pantalles amunt i avall amb les mans? Doncs exactament això es pot fer gràcies als sensors del Vision Pro, i amb molta precisió, segons afirmen els qui l’han provat. També respon a la nostra veu amb la famosa Siri a la qual li podem donar ordres o dictar textos. Aquests mecanismes d’entrada junt amb el seguiment de la posició dels nostres ulls fa que el Vision Pro pugui prescindir de dispositius externs com comandaments, palanques de control i altres accessoris, els altres grans absents a la presentació. En això també s’assembla molt a l’iPhone.

Tota la munió de sensors del Vision Pro serveix també per tornar-nos a connectar amb el món físic

Apple s’ha distingit sempre per les seves experiències centrades en l’usuari, la usabilitat dels seus productes el seu disseny minimalista; el fer més amb menys i millor. Això s’ha traduït en trencar regles preestablertes, que en computació vol dir repensar com interactuem amb la informació. Amb el Macintosh, als 80, va sumar el ratolí al teclat, amb l’iPod van fer possible accedir a milers de cançons amb la click-wheel, amb l’iPhone va prescindir d’un teclat que semblava intocable (gracieta buscada) i el va substituir pel multi-touch. En aquesta propera iteració ens proposa canviar el multi-touch per l’air-touch.

I finalment, la darrera semblança que li veig amb aquell primigeni iPhone és que no va ser el primer, sinó el darrer. Apple no entra mai en un mercat si no és amb la millor oferta tecnològica i d’experiència. Ho havia fet amb el Macintosh, amb l’iPod i amb l’iPhone; cap d’aquests productes va ser el primer, ni el més barat, ni el més potent, ni el que tenia més capacitat, però sí el definitiu. Tot el que ha vingut al darrere han estat variacions sobre el tema.

Apple deixa als seus socis prou temps per desenvolupar aplicacions perquè el Vision Pro faci un camí similar a l’iPhone

Farà el mateix camí el Vision Pro? Faran la resta el camí del Vision Pro? Ara mateix fa de mal dir per què no és un producte pensat per al gran consum. Que es presenti en una conferència de desenvolupadors a més de mig any vista del seu llançament ja ens hauria de donar pistes. Apple deixa als seus socis prou temps per a desenvolupar aplicacions perquè el Vision Pro faci un camí similar a l’iPhone. Tampoc no en podem parlar amb només una primera versió amb tan solament les aplicacions d’Apple disponibles (m’hi poseu un planetari immersiu i vaig a fer cua!). L’altra pista la tenim en el nom de la cosa. Com en el cas del Mac Pro (un ordinador que surt a més de 7.000 dòlars), el Pro indica segment professional. Plataformes de continguts audiovisuals (Disney era a la presentació), grans desenvolupadors de videojocs, centres d’art, parcs d’atraccions, professionals de l’audiovisual i el lleure, i en general, adoptants precoços no dubtaran a invertir-hi. Crec que no m’erro quan dic que, d’aquí a un any, Apple traurà les Vision, sense el Pro, a meitat de preu que ens semblarà a tots una ganga. Hauran pogut optimitzar costos i donaran un rendiment excel·lent per al gran públic. Els que ara paguin els 3.499 dòlars, pagaran la festa a la resta.

Dos dels altres grans oblidats, o marginats m’atreviria a dir, van ser “realitat virtual” i “metavers”. Era de preveure que un terme en hores baixes com el de “metavers”(és al mateix calaix que les cripto) no sortís enlloc. Encara més perquè Zuckerberg l’ha patrimonialitzat fins al punt de canviar el nom de la seva empresa a Meta i deixar-s’hi 1.370 milions de dòlars. Tampoc no va sortir cap referència a “realitat virtual”, la gran promesa des de fa 30 anys i que l’únic que ens ha donat és avatars ridículs sense cames. Ni cap menció ni cap imatge tridimensional generada. 

D’aquí a un any, Apple traurà les Vision, sense el Pro, a meitat de preu que ens semblarà a tots una ganga

I finalment el gran absent: intel·ligència artificial. I mira que costava no fer-hi referència donat l’estat de la qüestió. Segurament és per això, per la hiperinflació mediàtica del tema que Apple se n’ha volgut apartar. Per si no estava prou connotat el concepte, ara hi hem d’afegir les absurdes amenaces dels marxants de la por que ens diuen que la IA acabarà amb la civilització. Marvin Minsky, un dels seus creadors, parlava de concepte maleta, un concepte que conté molts significats i que cadascú desempaqueta com vol. Doncs ara hi hem empaquetat el “risc existencial”. I dic que costava perquè tots els sistemes d’Apple, des de la Siri al reconeixement intel·ligent de fotos, i molt especialment el Vision Pro, fan servir extensivament la IA. Per anar sobre segur els diferents presentadors es van referir a les capacitats d’aquests sistemes com a “machine learning” (aprenentatge màquina o aprenentatge automàtic, en la llengua de Marc Màrquez).

En aquesta línia, Apple té una potent divisió de recerca en IA. Ho sabem entre altres coses perquè el setembre del 2002 van publicar un article acadèmic anomenat “GAUDI: A Neural Architect for Immersive 3D Scene Generation” (“GAUDÍ, un arquitecte neural per a la generació d’escenes immersives 3D”). Els autors expliquen com el model GAUDÍ permet la generació d'escenes immersives tridimensionals a partir d’imatges d’un espai i a partir d’apunts de text (prompts) que descriguin l’escena desitjada. Parlant clar: que li podríem demanar a Siri el que volem veure a Vision Pro i GAUDÍ ens ho crearia. El model es diu així en honor a l’arquitecte català, autor de la frase: “La creació continua incessantment a través del mitjans dels homes”.

Diria que GAUDÍ és la killer app de Vision Pro. Si es fa realitat també seria i la killer app, la que podria acabar, amb tots els psicotròpics. Vist així, el Vision Pro em sembla fins i tot barat.