Sam Altman podría estar luchando por competir con los asistentes de voz de Apple Siri y Amazon Alexa.
OpenAI ha presentado una solicitud de marca comercial para construir «asistentes de voz digitales» y un «motor de voz», lo cual indica que podría estar listo para lanzar un nuevo producto.
La solicitud se presentó ante la Oficina de Patentes y Marcas de EE. UU. el martes, un día después de una entrevista con Sam Altman en la que dijo que OpenAI tiene «muchas otras cosas importantes que lanzar» antes de su próximo GPT-5.
Estas características podrían no materializarse, ya que las empresas a menudo presentan solicitudes de marcas comerciales para ideas que nunca ven la luz del día. Sin embargo, se espera que OpenAI lance una mejora «materialmente mejor» de su modelo ChatGPT a mediados de año, como informó anteriormente Business Insider.
En una entrevista con el podcaster Lex Fridman, Altman dijo: «Vamos a lanzar un nuevo modelo increíble este año. No sé cómo lo llamaremos. Lanzaremos en los próximos meses muchas cosas diferentes, creo que serán muy geniales.»
Agregó: «Creo que antes de hablar de un modelo como GPT-5 llamado así o no llamado así, un poco peor o un poco mejor de lo que esperarías de un GPT-5, creo que tenemos muchas otras cosas importantes para lanzar primero.»
La compañía aún no ofrece un asistente de voz digital a sus usuarios, aunque tiene una API que convierte el habla en texto llamada TTS, según su sitio web. También tiene un modelo de reconocimiento de voz de propósito general llamado Whisper.
OpenAI también presentó solicitudes de marca comercial para sus modelos futuros, incluyendo GPT-6 y GPT-7 en octubre.
La solicitud para GPT-6 incluye simular conversaciones, compartir conjuntos de datos con fines de aprendizaje automático, análisis predictivo, y «analizar algoritmos que pueden aprender a analizar, clasificar y tomar acciones en respuesta a la exposición a datos».
La solicitud de marca de GPT-7 cubre software que utiliza inteligencia artificial para la generación de música, la conversión de archivos de texto y datos en código de software, y la creación y generación de código de software. Ambas solicitudes están aún en examen.
La Oficina de Patentes podría no otorgar esas marcas comerciales, ya que en febrero rechazó los intentos de OpenAI de registrar «GPT». La agencia dijo que es un «acrónimo ampliamente utilizado» que es «meramente descriptivo» porque significa «transformadores preentrenados generativos».
La solicitud de marca «ingeniero de voz», que está pendiente de revisión por parte de un examinador, tiene la intención de cubrir software para las siguientes 10 áreas:
-
Construcción de asistentes de voz digitales
-
Reconocimiento de voz y habla, procesamiento de comandos de voz y conversión entre texto y voz
-
Procesamiento de comandos de voz y conversión entre texto y voz
-
Reconocimiento y generación automáticos de voz y habla
-
Generación de salidas de voz y audio basadas en indicaciones de lenguaje natural, texto, voz, indicaciones visuales, imágenes y/o video
-
Generación de audio y/o voz en respuesta a indicaciones de usuario
-
Procesamiento de lenguaje natural y habla basado en aprendizaje automático
-
Reconocimiento, traducción y transcripción de voz multilingüe
-
Uso de inteligencia artificial para la conversión automática de texto a voz y de texto a audio
-
Desarrollo de entrega de servicios de voz
OpenAI no respondió de inmediato a una solicitud de comentarios de Business Insider.
En Grupo MET podemos ayudarte a implementar esta y muchas mas herramienta para optimizar tu trabajo. ¡Contáctanos para saber más!