Hace dos décadas, el cofundador de Google Larry Page tuvo un sueño de escanear digitalmente millones de libros. Se convirtió en una larga y amarga batalla legal que la empresa eventualmente ganó. Hoy, la aparición de enormes modelos de IA está cambiando por completo este debate sobre el escaneo de libros. Pronto, Google lanzará un nuevo y poderoso modelo llamado Gemini 1.5 Pro que tiene una ventana de contexto de 1 millón de tokens. Eso equivale a aproximadamente 750,000 palabras, o el equivalente de 3 a 7 libros dependiendo de la longitud. También puede absorber 1 hora de video, 11 horas de audio y más de 30,000 líneas de código a través de indicaciones de usuario.
«Habilidades completamente nuevas»
Hasta hace poco, los modelos de IA solo podían manejar unos pocos miles de tokens. Esto significaba que los usuarios estaban limitados en sus interacciones con estos sistemas. Era un poco como tener una conversación con un amigo olvidadizo que tendría que reiniciar el chat desde cero de vez en cuando. Gemini 1.5 Pro se está presentando a unos pocos afortunados testers tempranos. Cuando se lance por completo, los usuarios podrán volcar series de libros completas, bases de código, historias legales enteras o realmente cualquier cosa que deseen. Este modelo de Google puede absorber toda esta información rápidamente y luego responder preguntas sobre los datos.
«Las ventanas de contexto más largas nos muestran la promesa de lo que es posible», dijo el CEO de Google, Sundar Pichai, al presentar Gemini 1.5 en febrero. «Permitirán capacidades completamente nuevas.»
Un gigantesco vacío digital
¿Qué hará Google con los datos que la gente comparte a través de Gemini 1.5? Después de intentar tan duro durante tantos años escanear millones de libros por sí mismo, Google ahora tendrá usuarios que voluntariamente vuelcan volúmenes enteros en su modelo de IA, junto con montañas de otros textos, códigos, imágenes y videos. Es muy probable que esta información se utilice como datos de entrenamiento para ayudar a Google a construir otros modelos. La aparición de la IA generativa ha desatado una carrera mundial por datos de alta calidad, por lo que una ventana de contexto enorme puede funcionar como un gigantesco aspiradora digital.
Google dice que los datos compartidos con Gemini «ayudan a mejorar y desarrollar productos, servicios y tecnologías de aprendizaje automático de Google». El aprendizaje automático es un tipo de IA. Por lo tanto, es seguro interpretar este comentario como un sí: Google usará estos datos para entrenar futuros modelos de IA.
Desarrolladores versus clientes corporativos
El gigante de internet trata de manera diferente la información compartida con sus modelos y servicios de IA, dependiendo de la oferta. Google AI Studio es una nueva herramienta para desarrolladores de Gemini. Para este servicio, la empresa dice que el contenido enviado «puede ser utilizado para mejorar nuestros servicios, incluidas nuestras tecnologías de aprendizaje automático». Vertex AI es una plataforma empresarial para clientes corporativos más grandes. Google le dijo a BI que en este caso la empresa «no utiliza los datos de los clientes para entrenar modelos de Google sin el permiso de ese cliente». Gemini 1.5 Pro, el modelo de IA más sofisticado de Google con la ventana de contexto más grande, aún no está disponible por completo, por lo que los términos de servicio no están disponibles. Un portavoz de Google se negó a comentar sobre qué enfoque de uso de datos se aplicará a este modelo superior. «Priorizaremos la transparencia, la elección y el control», agregaron.
Un nuevo y valiente mundo de IA
De cualquier manera, este es un valiente nuevo mundo de IA de intercambio de información. Probablemente por eso algunas grandes empresas han enviado advertencias nuevamente recientemente prohibiendo a los empleados compartir datos sensibles con modelos de IA. Google también advierte a los usuarios sobre compartir ciertos datos con sus modelos. «No envíe información sensible, confidencial o personal a los Servicios», dice la empresa en negrita en uno de sus actuales términos de servicio de Gemini.
Controles de datos rápidos
Aquí hay algunos consejos importantes para controlar cómo Google utiliza cualquier promoción que envíe a sus modelos de IA. Estos son de un portavoz de la compañía y de los términos de servicio de Google.
– Puede desactivar la Actividad de aplicaciones de Gemini a través de este panel. Esto evita que sus conversaciones futuras se utilicen para mejorar los modelos de IA generativa de Google.
– Si esta configuración está desactivada, sus conversaciones aún se guardarán durante un máximo de 72 horas para ayudar a Google a proporcionar el servicio de IA de Gemini y procesar cualquier comentario que desee compartir con la empresa.
– En esas 72 horas, a menos que dé comentarios, sus conversaciones tampoco se utilizarán para mejorar los productos de Google, incluidos sus modelos de IA.
– Si tiene 18 años o más, Google almacena la actividad de las aplicaciones de Gemini en su Cuenta de Google durante un máximo de 18 meses de forma predeterminada. Puede reducirlo a 3 o 36 meses en la configuración de Actividad de aplicaciones de Gemini.
– También puede revisar o eliminar su actividad en ese mismo panel en cualquier momento.
En Grupo MET podemos ayudarte a implementar esta y muchas mas herramienta para optimizar tu trabajo. ¡Contáctanos para saber más!