Con la integración de la inteligencia artificial (IA) generativa, estamos entrando en una nueva era en la forma en que interactuamos con estos dispositivos, además de hacernos más productivos con un equipo compacto y poderoso.
Conforme a los criterios de
Es importante aclarar que la IA ha estado presente en nuestros dispositivos móviles desde hace tiempo, en muchas de las aplicaciones que usamos. Sin embargo, ahora nos enfrentamos a un nuevo subconjunto: la inteligencia artificial generativa, también conocida como IAG o ‘gen AI’ (en inglés).
Según la empresa tecnológica IBM, la IA generativa es capaz de “crear contenido original, como texto, imágenes, video, audio o código de software, en respuesta a una instrucción o solicitud de un usuario”.
Entre las IA generativas más conocidas a nivel mundial se encuentran:
- ChatGPT
- DALL-E
- Stable Diffusion
- Midjourney
Grandes compañías líderes en el mercado, como Samsung y Apple, están a la vanguardia de esta revolución, implementando está tecnología en sus dispositivos para ofrecer nuevas y más potentes funcionalidades.
Por ejemplo, la empresa surcoreana, en colaboración con Google, anunció en enero de este año Galaxy AI, su conjunto de funcionalidades basadas en IA.
Detrás de ellas están modelos avanzados como Gemini Pro y Ultra, diseñados para realizar tareas complejas. Además, han implementado Gemini Nano, una versión optimizada de rápida respuesta para tareas básicas, como la interpretación de imágenes y resúmenes.
Esta tecnología ya es una realidad y se está expandiendo a dispositivos que llevan tiempo en el mercado. Actualmente, Galaxy AI está disponible en la línea S desde el S21 hasta el S24, en los celulares plegables desde el Z Fold3 hasta el Z Fold5 y desde el Z Flip3 hasta el Z Flip5, además de las tabletas Galaxy Tabs S8 y S9.
¿Cómo cambiarán los iPhone de Apple con la IA?
Apple, por su parte, está preparando un paquete de nuevas funciones basadas en IA generativa, incluyendo una actualización significativa de Siri, su asistente virtual.
Esta actualización permitirá a los usuarios navegar entre documentos, fotos y correos simplemente con comandos de voz. Estas funciones, anunciadas bajo el nombre de Apple Intelligence el pasado 10 de junio en la conferencia para desarrolladores WWDC, estarán disponibles al público en otoño de 2024.
En su anuncio, Tim Cook, Ceo de Apple, señaló que su enfoque “combina la IA generativa con el contexto personal de cada usuario para ofrecer una inteligencia verdaderamente útil. Además, accede a esa información de una forma totalmente privada y segura para ayudarlo a hacer lo que más le importa”.
Funcionamiento e implicaciones de la IA en celulares
Si bien lo que hay detrás de la IA generativa es tan complejo como maravilloso (miles y miles de cálculos en cuestión de segundos, intentando dar la mejor respuesta basada en millones de datos obtenidos de textos, imágenes, códigos y números a la consulta hecha por una persona), la IA generativa no es exclusiva de los expertos en tecnología; está diseñada para ser accesible a todos. Basta con usar el lenguaje o hacer un garabato en la pantalla para poder acceder a ella.
En términos generales, la IA generativa en los celulares se ha enfocado en ofrecer soluciones como la corrección y ajuste de tonos en textos, resúmenes de grandes volúmenes de información, edición de fotografías, transcripción de audios y generación de ‘stickers’ o emojis.
Por su parte, Samsung ha apostado por la traducción en tiempo real, tanto de manera presencial como a través de una llamada, y la generación de fotogramas para convertir un video convencional en uno de cámara lenta.
Mario Laffitte, vicepresidente de Asuntos Corporativos para Latinoamérica de Samsung, comenzó su carrera en la compañía en 2013. Desde entonces, ha sido testigo de primera mano de las innovaciones de la empresa, como el lector de huellas y de iris, y las pantallas plegables.
Al preguntarle si cree que estas herramientas de IA generativa llegarán a todos los usuarios, independientemente de la capacidad del celular, contestó:
“No, técnicamente no es posible porque la inteligencia artificial necesita la capacidad de procesamiento avanzada. Seguramente hay modelos de la gama media que no van a tener capacidad de soportar la demanda de la inteligencia artificial por cuenta de la capacidad técnica del equipo”.
Por este motivo, las empresas adoptan una aproximación que combina el cómputo nativo y en la nube.
En el caso de Samsung, como se aclaró en el documento del día del lanzamiento de Galaxy AI, la empresa usa los servicios de Google Cloud para los modelos avanzados, encargados del procesamiento y generación de textos en las aplicaciones Notas, Grabadora de voz y Teclado de Samsung, y de la edición de imágenes en la aplicación Galería.
Mientras que las tareas básicas se manejan localmente en el dispositivo con Gemini Nano, como la transcripción de notas de voz.
Las implicaciones de este enfoque son significativas. El cómputo nativo mejora la velocidad y la eficiencia al reducir la latencia y la dependencia de una conexión a internet constante, mientras que el cómputo en la nube permite aprovechar modelos de IA más potentes y complejos sin sobrecargar el ‘hardware’ del dispositivo.
Sin embargo, surge una duda necesaria: ¿qué pasa con nuestros datos?
Privacidad de los datos
La privacidad de los datos es una preocupación crítica en la implementación de la IA generativa. Basta con mirar toda la polémica que desató Meta, propietaria de Facebook e Instagram, entre otras plataformas, al anunciar que entrenaría sus modelos con las imágenes publicadas por usuarios de Europa en sus redes sociales.
Tras una solicitud del regulador de la privacidad de Irlanda, la empresa frenó su intento, aunque reiteró que siguen estando “muy seguros de que nuestro método cumple con las leyes y regulaciones europeas”, reafirmando sus planes.
La discusión no es menor, especialmente cuando hablamos de celulares, esos dispositivos que llevamos a todas partes, incluso al baño, y que registran toda nuestra información, incluidos nuestros datos biométricos cuando los emparejamos con un reloj inteligente.
Para ello, Apple ha introducido Private Cloud Compute, servidores cuyo hardware es fabricado por ellos mismo, permitiendo, en palabras de la compañía, “garantizar que los datos nunca se retengan ni se expongan”.
Por su parte, Samsung, a través de su panel de configuración, permite al usuario optar por procesar la información únicamente en el dispositivo. Además, para las compañías, permite a través de Knox bloquear ciertas funcionalidades para que los empleados no puedan usar IA generativa basada en la nube.
“Estamos muy atentos a las cuestiones de regulación internacional. Incluso antes de que existieran regulaciones específicas, ya teníamos nuestros protocolos, reconocidos mundialmente, como Samsung Knox, que se enfoca en la seguridad de los datos a nivel de hardware. Los datos están protegidos en el chip de Samsung. La capa de software de seguridad se aplica después, cuando la información se transmite”, señala Laffitte.
Las transformaciones que empezamos a ver en el mercado
Durante años se ha hablado de baterías, cámaras y procesadores, especialmente en términos de CPU y GPU, que determinan en parte el rendimiento y la calidad gráfica.
Antes del auge de la IA generativa, discutíamos sobre la tecnología de trazado de rayos en los videojuegos, cómo mejoraba el realismo en pantalla y cómo estas potentes GPU podían ofrecer imágenes más fluidas, aumentando la tasa de fotogramas por segundo.
Ahora, con la llegada de modelos de IA optimizados para ejecutarse de forma nativa en celulares, las Unidades de Procesamiento Neuronal (NPU) están cobrando relevancia.
Las NPU son procesadores especializados diseñados para ejecutar algoritmos de aprendizaje profundo y otras tareas de IA con mayor velocidad y menor consumo de energía.
En el futuro, es previsible que las especificaciones técnicas de los teléfonos móviles incluyan detalles sobre la capacidad de sus NPU, convirtiéndose en un nuevo estándar para evaluar el rendimiento de estos dispositivos.
Independientemente del factor de forma (si es plegable, más ancho o alargado), también podría cambiar la forma en que interactuamos, dejando atrás el paradigma táctil y adoptando la voz.
Esta es una de las promesas de Apple con su nuevo Siri: que podamos navegar por nuestro dispositivo, consultar información desde diferentes fuentes o realizar diversas acciones en nuestras aplicaciones con tan solo hablar.
Un dispositivo que también ha generado mucha atención es el Rabbit R1, un pequeño celular enfocado en la interacción a través de la voz. Este tiene una pantalla de solo 2.88 pulgadas y su sistema operativo implementa un modelo llamado ‘Large Action Model’, que en teoría puede interactuar con cientos de páginas web y aplicaciones para cumplir con las solicitudes del usuario. Sin embargo, por el momento abundan las críticas de las personas insatisfechas en la red.
“Creo que hay mucho potencial para desarrollar interfaces. Personalmente, prefiero la interfaz con texto, pero eso es solo mi opinión. Estamos muy atentos a las demandas del público, y las interfaces de voz se están volviendo mucho más populares y convenientes. ¿Dónde estará la pantalla en el futuro? Podría estar en las lentes de nuestras gafas, en lentes de contacto… No lo sé, pero la funcionalidad seguirá siendo crucial”, concluye Laffitte.
Finalmente, de lo que poco se habla, pero que puede marcar el curso de la democratización y apropiación de la IA generativa en celulares es quién asume el costo de la computación en la nube. Hoy es gratis y sin límites para el usuario, pero no se puede descartar que eso podría cambiar en un futuro.
Para solucionar este problema, a la industria se le abren diferentes caminos, además de lograr procesadores más potentes. Uno, encontrar más y mejores modelos que se puedan ejecutar eficiente y rápidamente en el dispositivo. Dos, cobrar una especie de suscripción para hacer uso de ciertos servicios. Tres, limitar el uso de las funcionalidades, tal como lo hace ChatGPT, que luego de un número de consultas (incluso habiendo pagado la suscripción), bloquea el acceso a sus modelos más avanzados.
[
,
, Celulares, IA, Inteligencia Artificial, Samsung, Apple, Modelos de lenguaje, Google