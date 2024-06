Buenos días,

En el episodio de esta mañana de Dithering, John Gruber y yo dimos nuestras reacciones iniciales al discurso de apertura de la WWDC de ayer.

Esta noche, Gruber está organizando su episodio anual en vivo de The Talk Show en Cupertino; ¡si tienes un Apple Vision Pro, puedes verlo en directo! Sandwich Vision ha lanzado una nueva aplicación Vision Pro llamada Theater y The Talk Show está listo para ser la primera transmisión en vivo estereoscópica en el Vision Pro. Para más detalles, consulta este artículo en 9to5Mac y la publicación de Gruber en Daring Fireball.

Continuando con la Actualización:

WWDC

Desde el Wall Street Journal:

Apple se unió a la carrera de la inteligencia artificial, diciendo el lunes que planea llevar una versión más personalizada de inteligencia artificial a sus 2.200 millones de usuarios de dispositivos, incluyendo un acuerdo con OpenAI, creador de ChatGPT. El nuevo sistema de IA, al que llamó “Inteligencia de Apple”, ofreció un adelanto de lo que muchos consideran el Santo Grial de la IA, un asistente de voz empoderado con suficiente información personal del usuario para ayudar de manera significativa a completar una variedad de tareas. Apple se asoció con OpenAI y su ChatGPT, para algunas nuevas funciones de IA, como responder a consultas más complejas o componer mensajes, capacidades que la IA de Apple no puede manejar. El anuncio se produce después de que el fabricante del iPhone viera estancado su valor de mercado en comparación con competidores que fueron más rápidos en incorporar la inteligencia artificial generativa en sus productos principales…

En su Conferencia Mundial de Desarrolladores, que se extenderá a lo largo de la semana, Apple dijo que su nuevo software recuperará información de todas las aplicaciones y escaneará la información personal para ayudar a los usuarios a corregir textos, llamar fotografías de miembros específicos de la familia o evaluar patrones de tráfico antes de un trayecto atípico. Los usuarios pueden crear imágenes y emojis e incluso convertir bocetos rudimentarios en diagramas pulidos. Una Siri actualizada podrá entender mejor el lenguaje natural, procesar información contextual y tomar medidas dentro de las aplicaciones. Los desarrolladores pueden utilizar nuevas herramientas para aprovechar los sistemas de IA, una perspectiva que ha entusiasmado a algunos inversores que han esperado que Apple pueda aprovechar su App Store para presentar nuevos productos. La mayoría de estas nuevas capacidades de Apple estarán disponibles más adelante este año…

La privacidad está en el corazón de las nuevas capacidades de IA de Apple, una característica que podría aumentar la fidelización de los usuarios en su ecosistema. La mayor parte del procesamiento se realizará en el dispositivo en lugar de enviarse a los servidores en la nube. Pero la compañía dijo que para ejecutar modelos de IA más grandes, Apple mantendrá la privacidad ejecutando sus propios servidores con lo que llama Private Cloud Compute. Solo enviará datos relevantes a la tarea a estos servidores. Los datos no se almacenan ni son accesibles por Apple para su posterior entrenamiento, dijo la compañía.

Esta fue una presentación de alto riesgo, y no solo para Apple dada la escrutinio en torno a la forma en que la compañía aborda la IA; fui el que tomó la oportunidad de escribir un artículo antes del evento argumentando que ¡Apple Intelligence llega en el momento adecuado! Sé que estoy siendo solipsista, pero afortunadamente también creo que tenía razón: creo que Apple arrasó en este evento y validó completamente mi tesis.

En primer lugar, la organización general del discurso principal fue casi perfecta: Apple comprimió el horario habitual del discurso principal de la WWDC, que está organizado por sus diversos sistemas operativos, en la primera hora del discurso principal. Esto fue relativamente fácil de hacer porque no había tantas nuevas funciones que anunciar en ninguno de los sistemas operativos; esto fue en realidad una indicación de lo grande que fue la sección de inteligencia artificial, porque definitivamente sentiste que Apple dejó caer casi todo en lo que trabajaban durante el último año para centrarse en la Inteligencia de Apple.

Ten en cuenta que hubo partes de esa primera hora que tocaron no solo el aprendizaje automático en general, sino la inteligencia artificial generativa específicamente. Safari, por ejemplo, generará resúmenes de páginas web para ti; la distinción, como Gruber me explicó en Dithering, es que esa capacidad estará disponible sin importar tu dispositivo. Todo en la sección de Inteligencia de Apple, sin embargo, solo está disponible en el iPhone 15 Pro y las Macs Modelo M, lo que parece validar mi suposición de ayer de que los dispositivos necesitan un mínimo de 8GB de RAM para ejecutar los modelos en el dispositivo que están en la base de la Inteligencia de Apple.

Entonces, ¿qué es la Inteligencia de Apple? Para mí, la explicación fluye directamente de la Estrategia 101: la Inteligencia de Apple es la aplicación de la IA generativa a casos de uso y contenido que Apple está en una posición única para proporcionar y acceder. Está diseñado, para construir sobre el artículo de ayer, para maximizar las ventajas que Apple tiene en términos de ser el proveedor del sistema operativo en tu teléfono; y, por otro lado, lo que no es es ningún tipo de chatbot de propósito general: ahí es donde entra OpenAI – y solo ahí.

Inteligencia de Apple

En cuanto a los detalles, la presentación de Apple fue muy organizada:

Las capacidades de la Inteligencia de Apple son el lenguaje, la generación de imágenes, acciones, comprensión del contexto personal y privacidad.

La infraestructura de la Inteligencia de Apple es el procesamiento en el dispositivo utilizando modelos diseñados por Apple (que, según Apple, se comparan favorablemente con los modelos Phi de Microsoft, el referente actual para modelos pequeños), y el procesamiento en la nube a través de centros de datos propiedad de Apple que ejecutan servidores equipados de alguna manera con Apple Silicon. Apple promete que este último está diseñado de tal manera que todas las solicitudes están garantizadas para ser privadas y desechadas inmediatamente.

Estas capacidades e infraestructura se exponen a través de diversas experiencias, incluyendo una Siri renovada que puede realizar acciones en aplicaciones (en la medida en que las admiten); herramientas de escritura que incluyen reescritura, cambios de tono y corrección de pruebas; resumen de cosas como correos electrónicos y notificaciones; genemoji (es decir, emoji generados en el estilo de las ofertas de emoji actuales); un componente a nivel de sistema llamado Image Playground que los desarrolladores pueden incorporar en sus aplicaciones; y nuevas experiencias en Notas y Fotos.

La parte clave aquí es el fragmento “comprensión del contexto personal”: la Inteligencia de Apple sabrá más sobre ti que cualquier otra IA, porque tu teléfono sabe más sobre ti que cualquier otro dispositivo (y sabe lo que estás viendo cada vez que invocas la Inteligencia de Apple); esto, por extensión, explica por qué las partes de la infraestructura y privacidad son tan importantes.

Esto significa que la Inteligencia de Apple se centra en gran medida en casos de uso específicos donde ese conocimiento es útil; eso significa que el espacio de problemas que la Inteligencia de Apple intenta resolver está restringido y fundamentado – tanto figurativa como literalmente – en áreas donde es mucho menos probable que la IA cometa errores. En otras palabras, Apple está abordando un espacio que es muy útil, que solo ellos pueden abordar, y que también resulta ser “seguro” en términos de riesgo reputacional. Sinceramente, casi parece injusto, o, dicho de otra manera, habla de la gran ventaja que supone ser una plataforma de confianza. Apple tiene la oportunidad de resolver problemas reales de manera significativa con bajo riesgo, y eso es exactamente lo que está haciendo.

Contrasta esto con lo que OpenAI está intentando lograr con sus modelos GPT, o Google con Gemini, o Anthropic con Claude: esos grandes modelos de lenguaje están tratando de incorporar todo el conocimiento público disponible para saberlo todo; es un espacio de problemas dramáticamente más grande y más difícil, por lo que cometen errores. También hay muchas cosas que no saben porque esa información está bloqueada – como toda la información en un iPhone. Eso no quiere decir que estos modelos no sean útiles: son mucho más capaces y conocedores que lo que Apple está intentando construir para cualquier cosa que no dependa del contexto personal; también todos intentan lograr lo mismo.

Apple Aggregates AI

Noté anteriormente que la organización de Apple del discurso principal fue “casi perfecta”; creo que la compañía cometió un error al colocar la integración de OpenAI al final, lo que parece haber dado la impresión a algunos de que toda la Inteligencia de Apple estaba impulsada por OpenAI. Por ejemplo:

Si Apple integra OpenAI a nivel de sistema operativo, entonces los dispositivos Apple serán prohibidos en mis empresas. Esa es una violación de seguridad inaceptable.

— Elon Musk (@elonmusk) 10 de junio de 2024

Es absolutamente absurdo que Apple no sea lo suficientemente inteligente para crear su propia IA, ¡pero de alguna manera es capaz de garantizar que OpenAI protegerá tu seguridad y privacidad!

Apple no tiene ni idea de lo que realmente está sucediendo una vez que entrega tus datos a OpenAI. Te están vendiendo por nada.

— Elon Musk (@elonmusk) 10 de junio de 2024

Ahora, Musk tiene su propia queja contra OpenAI, lo que, uno imagina, está influyendo en su vehemencia, pero vale la pena abordar sus preocupaciones directamente. Apple fue cristalino en el sentido de que ChatGPT efectivamente se está integrando en una interfaz modular que estará disponible para múltiples modelos; así es como el Vicepresidente Sénior de Ingeniería de Software, Craig Federighi, anunció la “asociación” con OpenAI:

La Inteligencia de Apple está disponible de forma gratuita con iOS 18, iPadOS 18 y macOS Sequoia, brindándote inteligencia personal en los productos que usas todos los días.

Aun así, hay otras herramientas de inteligencia artificial que pueden ser útiles para tareas que se basan en un amplio conocimiento del mundo, o que ofrecen experiencia especializada en dominios. Queremos que puedas utilizar estos modelos externos sin tener que saltar entre diferentes herramientas. Así que los estamos integrando directamente en tus experiencias, y estamos comenzando con los mejores de estos: el pionero y líder del mercado, ChatGPT de OpenAI, impulsado por GPT-4o.

En primer lugar, integramos soporte en Siri, para que Siri pueda aprovechar la experiencia de ChatGPT cuando pueda ser útil para ti. Por ejemplo, si necesitas ideas de menú para una comida elaborada para hacer para amigos usando pescado recién capturado e ingredientes de tu jardín, simplemente pregúntale a Siri. Siri determina que ChatGPT podría tener buenas ideas para esto, te pide permiso para compartir tu pregunta y presenta la respuesta directamente.

También puedes incluir fotos con tus preguntas; si deseas algún consejo sobre decoración, puedes tomar una foto y preguntar qué tipo de plantas quedarían bien en esta terraza. Siri confirma si está bien compartir tu foto con ChatGPT, y te trae sugerencias relevantes. Es una integración perfecta. Además de Fotos, también puedes hacer preguntas relacionadas con tus documentos, presentaciones o PDFs. También hemos integrado ChatGPT en las herramientas de escritura a nivel del sistema con “componer”. Puedes crear contenido con ChatGPT para lo que sea que estés escribiendo. Supongamos que quieres crear un cuento personalizado para dormir para tu hija de seis años que ama las mariposas y resolver acertijos: coloca tu idea inicial y envíala a ChatGPT para obtener algo que le encantará.

“Componer” también puede ayudarte a aprovechar las capacidades de imagen de ChatGPT para generar imágenes en una amplia variedad de estilos para ilustrar tu cuento de dormir. Podrás acceder a ChatGPT de forma gratuita sin crear una cuenta. Tu solicitud y tu información no se registrarán. Y para los suscriptores de ChatGPT, podrás conectar tu cuenta y acceder a funciones pagadas directamente desde nuestras experiencias. Por supuesto, tendrás control sobre cuándo se usa ChatGPT, y se te pedirá antes de que se comparta cualquier información tuya. La integración de ChatGPT llegará a iOS 18, iPadOS 18 y macOS Sequoia más adelante este año.

También tenemos la intención de agregar soporte para otros modelos de IA en el futuro.

En primer lugar, que la Inteligencia de Apple sea gratuita es notable: Apple claramente – y con razón, en mi opinión – ve la Inteligencia de Apple como una forma de diferenciar sus dispositivos (y potencialmente vender dispositivos más caros en el futuro).

En segundo lugar, Federighi hace el mismo punto que hice anteriormente: hay muchas cosas que los modelos generalizados como ChatGPT hacen bien y que Apple ni siquiera intenta abordar, ¿y por qué lo haría? Estos modelos cuestan una cantidad astronómica de dinero para entrenar e inferir, y cualquier diferenciación existente se basa en factores en los que Apple no tiene una ventaja competitiva. Lo que Apple tiene es una base de usuarios masiva que el modelo que quiera ganar deseará tener acceso, así que ¿por qué no comerciar ese acceso por la capacidad de aprovechar cualquier modelo que acepte los términos de Apple?

Esto llega al único aspecto en el que creo que me equivoqué en el artículo de ayer: mi suposición ha sido que Apple iba a pagar por cualquier integración que ofreciera, pero ahora cuestiono si ese es el caso o no. OpenAI dijo en su publicación de blog sobre la asociación:

La integración de ChatGPT, impulsada por GPT-4o, llegará a iOS, iPadOS y macOS más adelante este año. Los usuarios pueden acceder de forma gratuita sin crear una cuenta, y los suscriptores de ChatGPT pueden conectar sus cuentas y acceder a funciones de pago directamente desde estas experiencias.

Esto suena a una estrategia para adquirir usuarios y presencia en la mente del consumidor, con el potencial de convertir a esos usuarios en suscriptores, es decir, el mismo modelo que tiene OpenAI en su sitio web y aplicaciones. Además, si esta asociación implica que Apple no paga, también explica por qué OpenAI es la única opción para comenzar: Google, por ejemplo, probablemente quería que se le pagara por Gemini, o Anthropic por Claude, y puedo imaginar (1) que Apple mantendrá su postura de no pagar, especialmente si (2) OpenAI está llevando a cabo una estrategia agresiva para desarrollar su negocio de consumo y convertirse en una marca duradera y ganadora en el espacio del consumidor. En resumen, mi pensamiento actual actualizado es que tanto Apple como OpenAI están apostando a que los modelos de lenguaje muy grandes se están volviendo cada vez más commoditized, lo que significa que Apple no tiene que pagar para obtener acceso a uno, y OpenAI ve la escala y la presencia en la mente del consumidor como el mejor camino hacia un negocio sostenible.

En otras palabras, y en términos de Stratechery, Apple se está posicionando como un Agregador de IA: la empresa posee a los usuarios y, por extensión, la demanda de IA generativa por ser propietaria de sus plataformas, y está profundizando su foso a través de la Inteligencia de Apple, que solo Apple puede hacer; esa demanda luego se está utilizando para presionar a los proveedores que probablemente tengan que asumir los costos de obtener acceso privilegiado a la base de usuarios de Apple.

En otras palabras, en la medida en que Musk odia a OpenAI, debería estar contento con esta asociación: Apple claramente no está compartiendo datos privados con OpenAI, y sinceramente, las advertencias que aparecen cada vez que accedes al servicio probablemente se volverán bastante molestas bastante rápido; lo que la empresa está haciendo es proporcionar una interfaz estandarizada para que OpenAI pueda acceder a posibles clientes para casos de uso impresionantes pero commoditized que Apple no necesita gastar recursos en desarrollar, porque OpenAI y cualquiera de sus posibles competidores estarán obligados a hacer la inversión y aceptar los términos de Apple en un intento de encontrar alguna ventaja sostenible.

Esto no significa que OpenAI esté cometiendo un error: llevo mucho tiempo pidiendo a la