Un grupo de científicos y emprendedores fundaron OpenAI en 2015 con el objetivo de promover y desarrollar la tecnología de inteligencia artificial para beneficio de toda la humanidad. Desde sus inicios, OpenAI ha logrado avances significativos, como ChatGPT, un modelo de lenguaje natural con el que se puede conversar de cualquier tema, o Dall-E, un sistema que genera imágenes realistas a partir de descripciones de texto. Veamos la historia de OpenAI.
Desde su fundación, OpenAI ha desempeñado un papel fundamental en la investigación y el desarrollo de algunos de los modelos de IA (inteligencia artificial) más avanzados y poderosos del mundo. Sus contribuciones han abarcado una amplia gama de áreas, desde modelos de lenguaje generativos hasta sistemas de visión por computadora o robótica. Uno de los hitos más destacados en su historia fue el lanzamiento de ChatGPT en 2022, un modelo de lenguaje de tercera generación que asombró al mundo con su capacidad para comprender y generar texto de una manera casi humana.
ChatGPT es un algoritmo de inteligencia artificial con el que se puede mantener una conversación como si se hablara con un amigo. Se le pueden hacer preguntas complejas, que resuelva un problema, que resuma un texto o que cree un ensayo sobre cualquier tema. Además, como recuerda lo que se está hablando, se puede entablar una conversación de forma muy natural.
Aunque OpenAI surgió como una empresa sin ánimo de lucro, a los pocos años cambió su modelo de negocio. Por un lado, contribuye al avance del conocimiento en el campo de la IA realizando investigaciones que publica en código abierto. Por otro lado, OpenAI también desarrolla productos y servicios comerciales, como la API de OpenAI, que permite a las empresas integrar la tecnología de IA en sus propios productos.
La historia de OpenAI está marcada por la ambición de innovación. Aunque la empresa ha logrado avances impresionantes, esta historia también ha estado marcada por desafíos y debates éticos sobre los peligros de la IA para la sociedad. En cualquier caso, parece que el futuro de OpenAI es prometedor, y es probable que la empresa siga desempeñando un papel fundamental en la configuración del futuro de la inteligencia artificial.
Precedentes. Deep Mind
Demis Hassabis era un niño prodigio. Estudió informática en la Universidad de Cambridge (Reino Unido) donde se graduó en 1997. Trabajó brevemente como programador de juegos, pero en 1998, con 22 años, fundó la compañía Elixir Studios. Se dedicaban a desarrollar juegos informáticos, algunos de los cuales tuvieron gran éxito en la época (por ejemplo, Republic: The Revolution o Evil Genius). Llegó a tener 60 empleados y la compañía la terminaría vendiendo unos años más tarde.
Hassabis cambió de rumbo, pasando del desarrollo de juegos a una carrera en neurociencia. En 2007 empezó los estudios de doctorado en neurociencia cognitiva en el University College London (UCL). Durante este tiempo, Hassabis publicó varios artículos sobre la memoria y la amnesia, algunos de los cuales fueron incluidos en la lista de los 10 mejores avances científicos de 2007 por la revista Science.
Aunque Hassabis terminó su doctorado en 2009. Continuó su investigación en neurociencia e IA en la Unidad de Neurociencia Computacional Gatsby de la UCL. También fue investigador visitante en el MIT y Harvard.
En 2011 decidió volver a emprender. Junto con Shane Legg y Mustafa Suleyman fundaron en Londres la empresa DeepMind. Su objetivo era la investigación y el desarrollo de sistemas de inteligencia artificial. Entre sus primeros desarrollos se encuentra una red neuronal que aprendía a jugar a los videojuegos de Atari como lo hace un ser humano, esto es, simplemente observado en una pantalla cómo juegan otros.
Desde entonces, las principales firmas de capital de riesgo e inversores privados se decidieron a invertir en la compañía. Empresas como Horizons Ventures o Founders Fund o reconocidos inversores como Scott Banister o Jaan Tallinn se convirtieron en sus primeros inversionistas.
En 2013, DeepMind empezó a colaborar con Facebook en el desarrollo de nuevas tecnologías de inteligencia artificial relacionadas con la realidad virtual y aumentada. Uno de estos proyectos fue el desarrollo de un sistema de inteligencia artificial que pudiera jugar al juego de mesa Go. El proyecto se llamaba AlphaGo y años más tarde, en 2016, con la ayuda de OpenAI, derrotaría a Lee Sedol, el campeón mundial de Go. Esto hizo que DeepMind apareciera en muchos titulares de prensa.
A pesar de lo anterior, Google le tomó la delantera a Facebook y el 26 de enero de 2014 anunció que había acordado adquirir Tecnologías DeepMind. Se dice que Google pagó 400 millones de libras esterlinas por DeepMind (unos 480 millones de euros, en aquella época).
Google ya tenía un equipo de investigación trabajando en inteligencia artificial al que llamaba Google Brain. La idea era fusionarlos para formar una nueva unidad llamada Google DeepMind, liderada por Demis Hassabis. Según Google, esta unidad se encargaría de acelerar el progreso hacia una inteligencia artificial general que ayude a resolver los mayores desafíos que enfrenta la humanidad.
El hecho es que muchos científicos, emprendedores y personas relevantes en el sector se quedaron impresionados por los trabajos de DeepMind y se preocuparon por el potencial de que una sola empresa, Google, dominara el campo de la IA. Para ellos, era importante crear una organización que pudiera competir con DeepMind y promover el desarrollo de la IA de una manera segura y responsable.
DeepMind fue el gran inspirador que motivó a los fundadores de OpenAI a dar un paso adelante para crear su proyecto independiente.
Quien era Sam Altman
Samuel Harris Altman nació en Chicago (Estados Unidos) en abril de 1985. Aunque empezó a estudiar informática en la Universidad de Stanford, después de dos cursos, abandonaría estos estudios para fundar la empresa Loopt en 2005. Curiosamente, emprendedores de éxito como Bill Gates (Microsoft), Mark Zuckerberg (Facebook), Steve Jobs (Apple) o Elon Musk (Tesla y SpaceX) habían hecho lo mismo anteriormente. Loopt fue una de las primeras empresas en desarrollar una aplicación de redes sociales basada en la ubicación. Permitía a los usuarios compartir su ubicación en tiempo real con amigos y descubrir lugares cercanos de interés. En aquel entonces las redes sociales estaban en sus inicios. Altman acabaría vendiendo Loopt a Green Dot Corporation.
En 2011, Altman empezó a trabajar como socio en una aceleradora de startups (empresas emergentes) llamada Y Combinator. Esta empresa ayudó a lanzar miles de proyectos, algunos de gran éxito, como Airbnb, Dropbox, Zenefits o Stripe. Altman fue nombrado presidente de Y Combinator en febrero de 2014. Altman no había cumplido todavía los 30 años. Ese año, la valoración total de las empresas de Y Combinator superaban los 65.000 millones de dólares.
La revista Forbes nombró a Altman en 2015 como el principal inversor menor de 30 años. Por otro lado, la revista Business Week lo nombraría como uno de los mejores jóvenes emprendedores en tecnología.
El origen de OpenAI
En junio de 2015, Altman organizó una comida en el restaurante The House of Prime Rib en San Francisco. A esta comida asistieron varios investigadores y emprendedores en el campo de la tecnología. Los más conocidos eran Elon Musk, Ilya Sutskever, Greg Brockman y Wojciech Zaremba, entre otros. Hablaron del potencial de la inteligencia artificial, de los avances que estaba consiguiendo DeepMind y de los riesgos de seguridad que suponía que se instaurara un monopolio en esta tecnología tan disruptiva.
En esta comida se decidió crear una empresa sin fines de lucro que pudiera competir con DeepMind y que tuviera la misión de asegurar que la inteligencia artificial general beneficie a toda la humanidad, no solo a unos pocos. Esta empresa era OpenAI, cuya traducción seria inteligencia artificial abierta. Según parece, el nombre se le ocurrió a Elon Musk. La empresa OpenAI se crearía en diciembre de 2015 como una organización sin fines y cuyo objetivo era el de investigar y desarrollar la inteligencia artificial de manera responsable.
En esta comida se decidió crear una empresa sin fines de lucro que pudiera competir con DeepMind y que tuviera la misión de asegurar que la inteligencia artificial general beneficie a toda la humanidad, no solo a unos pocos
Los fundadores declararon abiertamente que su finalidad era «promover la inteligencia digital de la manera que más probablemente beneficie a la humanidad en su conjunto«. Además de lo anterior, OpenAI declaró su intención de colaborar libremente con otras instituciones e investigadores y hacer que su trabajo esté abierto al público.
En cualquier parte del mundo habría sido difícil poner en marcha este proyecto. Pero estamos hablando de California y de una reunión de emprendedores y científicos de éxito, con conocimiento, reputación y dinero. El proyecto empezó a estar financiado por Altman, Brockman, Elon Musk, Jessica Livingston, Peter Thiel, Amazon Web Services, Infosys e Y Combinator Research. En cualquier caso, no tuvieron ningún problema para captar una financiación externa de mil millones de dólares.
Sam Altman: «Sabíamos lo que queríamos hacer, sabíamos por qué queríamos hacerlo, pero no teníamos ni idea de cómo”.
La captura de talento
OpenAI se presentaba como un proyecto humanista creado para el beneficio de la humanidad. Además, como contaba con recursos generosos, estaba dispuesto a pagar altos salarios. ¿Quién no querría trabajar en una empresa así?. OpenAI sedujo a profesionales con gran experiencia provenientes de empresas como Microsoft o Google. Algunos, incluso rechazaron ofertas económicas mejores atraídos por la causa. El resultado es que a lo largo de 2016 OpenAI logró reunir a un equipo de los mejores investigadores en el campo de la IA.
La captura de talento es siempre un gran reto para cualquier proyecto. Frecuentemente, es el secreto del éxito de un emprendimiento tecnológico. En este caso, algunos de los factores que contribuyeron a su éxito en la captación de profesionales cualificados fueron:
- Misión atractiva: OpenAI se propuso un objetivo ambicioso y atractivo: «asegurar que la inteligencia artificial general beneficie a toda la humanidad«. Esta misión era ilusionante para muchos investigadores y desarrolladores que buscaban trabajar en un proyecto con un impacto positivo en el mundo.
- Liderazgo fuerte: OpenAI fue fundada por un grupo de líderes reconocidos en el campo de la tecnología, incluyendo a Sam Altman, Elon Musk e Ilya Sutskever. La participación de estas figuras prominentes atrajo a muchos talentos que buscaban trabajar con los mejores en el campo.
- Recursos financieros: OpenAI recaudó una cantidad significativa de capital, lo que le permitió ofrecer salarios competitivos y beneficios a sus empleados. Esto fue un factor importante para atraer a los mejores talentos del mercado.
- Cultura de colaboración: OpenAI se caracteriza por una cultura de colaboración abierta, donde los investigadores son libres de compartir ideas y trabajar juntos en proyectos. Esta cultura atrajo a muchos talentos que buscaban un entorno de trabajo estimulante y desafiante.
- Oportunidad de aprendizaje: OpenAI ofrece a sus empleados la oportunidad de trabajar en algunos de los proyectos de investigación de inteligencia artificial más avanzados del mundo. Esto atrajo a muchos talentos que buscaban aprender y crecer en un entorno de rápido desarrollo.
La captura de talento de OpenAI iba en detrimento de otras empresas del sector. Este es el caso de empresas como DeepMind, Facebook AI Research o Microsoft. Las dificultades para captar talento afectó a las áreas de aprendizaje profundo (deep learning) o aprendizaje por refuerzo de estas empresas. Aunque éstas se quejaron de la pérdida de talento y de competencia desleal, lo cierto es que OpenAI no hacía nada ilegal y habitual en cualquier mercado.
Altman (2016): «O esclavizamos a la inteligencia artificial o nos esclavizará a nosotros«.
Los fundadores de OpenAI
Como hemos visto, los fundadores de OpenAI fueron un grupo de personas relevantes en el mundo de la tecnología y del emprendimiento. Para hacernos una idea, éstos son algunos de sus perfiles:
- Greg Brockman es un empresario y experto en tecnología de Silicon Valley. Estudió ingeniería informática en Harvard. Brockman siempre ha defendido la importancia de promover la seguridad y la responsabilidad en el uso de la inteligencia artificial.
- Elon Musk es un empresario, inventor e ingeniero conocido por ser el fundador de varias empresas disruptivas en el sector tecnológico, incluyendo Tesla, SpaceX, Paypal, Neuralink y The Boring Company. Aunque Musk ha sido ampliamente criticado por su estilo de liderazgo y por su posicionamiento en determinados asuntos públicos, no cabe duda de que ha demostrado tener una visión audaz y una gran capacidad para sacar adelante proyectos aparentemente imposibles.
- Ilya Sutskever es uno de los principales expertos mundiales en redes neuronales y de aprendizaje profundo. Antes de fundar OpenAI, Sutskever trabajó como investigador en Google Brain y colaboró con el inventor del algoritmo de aprendizaje profundo de redes neuronales convolucionales, Geoffrey Hinton.
- John Schulman es un investigador en aprendizaje por refuerzo. Antes de unirse a OpenAI, Schulman trabajó como científico investigador en la Universidad de California, Berkeley y colaboró en la creación de «The Berkeley Robot Learning Lab«.
- Wojciech Zaremba es un científico que ha trabajado en el desarrollo de algoritmos de aprendizaje profundo y redes neuronales. Antes de unirse a OpenAI, Zaremba trabajó en Google Brain y colaboró en la creación de varios modelos de lenguaje basados en redes neuronales, incluido el modelo LSTM (Long Short-Term Memory, es una arquitectura de red neuronal que se utiliza comúnmente en el procesamiento del lenguaje natural).
Aunque esta fue una reunión privada de la que no trascendieron muchos detalles, dicen que también asistieron: Peter Thiel (cofundador de PayPal), Reid Hoffman (cofundador de LinkedIn), Jessica Livingston (cofundadora de Y Combinator), Stuart Russell (profesor de informática en la Universidad de California, Berkeley), Yoshua Bengio (profesor de informática en la Universidad de Montreal) y Geoffrey Hinton (profesor de informática en la Universidad de Toronto).
OpenAI Gym
En aquellos tiempos, la tecnología de inteligencia artificial que estaba cosechando éxitos era el aprendizaje por refuerzo. Deep Mind de Google lo había utilizado para desarrollar su famoso AlphaGo. Esto llevó a OpenAI a decantarse por esta tecnología para iniciar sus investigaciones.
Para poder desarrollar software que resuelva problemas mediante inteligencia artificial es necesario definir los problemas a resolver y poder hacer infinitas pruebas que lleven al perfeccionamiento de la solución. Para poder hacer esto, a OpenAI se le ocurrió que lo primero que necesitaban era una plataforma de pruebas. En abril de 2016 presentaron OpenAI Gym. Se trataba de un sistema que permitía entrenar algoritmos de aprendizaje por refuerzo en distintos entornos.
OpenAI Gym proporcionaba entornos como juegos clásicos de Atari, juegos de mesa o entornos virtuales sobre los que controlar robots en 2D o 3D. OpenAI invitaba a terceros a conectar sus algoritmos de aprendizaje por refuerzo a OpenAI Gym usando Python. Como decía la documentación “nosotros ponemos el medio ambiente, usted pone el algoritmo”. Si eres una empresa que estás desarrollando un algoritmo para aprender a jugar a Go, en este entorno lo puedes entrenar. En definitiva, se trataba de una plataforma software sobre la que poder realizar trabajos de investigación.
Por cierto, el sistema de aprendizaje por refuerzo se basa en otorgar recompensas virtuales cuando el desarrollo del algoritmo va obteniendo resultados positivos y hacer que el software busque los caminos con las mayores recompensas posibles. OpenAI Gym era el gimnasio de este tipo de algoritmos.
Para que la plataforma OpenAI Gym pudiera funcionar fue necesario que OpenAI desplegara una importante infraestructura en la nube. Este sistema de última generación debía permitir ejecutar simulaciones a gran escala y entrenar modelos de IA con grandes conjuntos de datos. Por otro lado, como OpenAI Gym es de código abierto, cualquiera podía acceder y modificar el código. Esto ha permitido a una gran comunidad de investigadores y desarrolladores contribuir al desarrollo de la plataforma.
Por ejemplo, OpenAI se gastó en 2017 unos 8 millones de dólares en servidores en la nube. Una cifra nada despreciable si tenemos en cuenta que el presupuesto para ese año era de unos 32 millones de dólares. Aunque pueda parecer mucho, Google se gastó ese mismo año 442 millones de dólares en las actividades de DeepMind.
Sam Altman: «La IA tiene el potencial de ser la tecnología más importante de la historia de la humanidad. Podría ser la herramienta que finalmente nos ayude a resolver algunos de los problemas más difíciles del mundo, como la pobreza, el hambre y las enfermedades»
Quien utiliza OpenAI Gym
OpenAI Gym ha sido utilizado por miles de investigadores y desarrolladores de todo el mundo. Por ejemplo, DeepMind utilizó OpenAI Gym para mejorar sus famosos algoritmos AlphaGo (juego de Go) y AlphaZero (juego de ajedrez). Por su parte, Facebook AI Research utilizó esta plataforma para desarrollar algoritmos de robótica y juegos.
Evidentemente, OpenAI utilizó también este entorno para el desarrollo de sus propios proyectos de inteligencia artificial. Entre ellos, podemos destacar los siguientes:
- Universe. El objetivo de este proyecto es el entrenamiento de algoritmos que pudieran jugar a juegos de mesa y realizar tareas en el mundo real.
- Roboschool. Este proyecto proporciona un entorno de aprendizaje para la robótica.
- Dactyl. Está orientado al desarrollo de robots que pueden manipular objetos con destreza humana.
- Superhuman Gym: Se trata de un conjunto de desafíos de aprendizaje por refuerzo que son más complejos que los mostrados en OpenAI Gym.
Como se puede ver, la plataforma OpenAI Gym ha contribuido significativamente al avance del campo de la IA y ha sido fundamental para el desarrollo de algoritmos de IA de última generación.
LLM. Modelo de lenguaje natural de gran tamaño
Llegó un momento en el que OpenAI se vio preparada para afrontar retos mayores. En esa época se estaban desarrollando nuevas teorías sobre el desarrollo de redes neuronales, así que OpenAI se decidió a investigarlas. Las redes neuronales son un tipo de algoritmo (un modelo matemático) que es muy eficiente para procesar información y resolver problemas basados en el aprendizaje automático (deep learning). Esto es, las respuestas las obtiene el sistema gracias a un intenso proceso de entrenamiento previo. A medida que la red se entrena con más datos, va ajustando sus parámetros internos para proporcionar respuestas más precisas.
Las redes neuronales prometían convertirse en una herramienta poderosa y versátil en el campo de la inteligencia artificial. OpenAI se planteó el reto de desarrollar un modelo de lenguaje natural basado en redes neuronales con el que se pudiese hablar de forma similar a como se conversa con un humano. Este tipo de modelos se conocen con el nombre de LLM o modelo de lenguaje de gran tamaño.
En 2017, Ashish Vaswani trabajaba en Google Brain buscando una forma más eficaz de que un sistema informático pudiera interpretar un texto. A alguien se le ocurrió la idea de, en vez de hacerlo palabra a palabra, interpretar frases completas mediante lo que denominaron la autoatención. En poco tiempo crearon un grupo de trabajo y acabaron escribiendo un artículo llamado ‘Atención es todo lo que necesitas’. El equipo de Vaswani lo formaban Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser e Illia Polosukhin.
En este artículo proponía una forma distinta de abordar la creación de modelos de lenguaje natural de gran tamaño. Describía una arquitectura de red neuronal a la que llamaron Transformer (transformador). Esta red utiliza una técnica a la que denominaron técnica de atención (attention). Esta técnica permite al modelo aprender patrones de relaciones entre diferentes partes de un texto. La atención ayuda al modelo a identificar qué partes del texto son relevantes para una tarea específica y les da un mayor peso en la generación de la respuesta de salida.
Si le interesa saber más sobre cómo funciona esta tecnología por dentro, puede consultar el artículo Qué es ChatGPT y cómo funciona. Si no tiene claro qué son las redes neuronales, aquí puede saber más: Redes neuronales. Qué son y cómo funcionan
Nacimiento de GPT
Cuando en OpenAI conocieron el trabajo de Vaswani, vieron claramente el camino que tenían que seguir para el desarrollo de su modelo LLM. De hecho, llamaron a su modelo GPT o Generative Pre-trained Transformer (modelo transformador generativo preentrenado). Una vez más, Google sirvió de inspiración a OpenAI.
En OpenAI se pusieron a trabajar en este modelo poco después de la publicación del trabajo de Vaswani. Después de analizarlo publicaron un artículo de investigación titulado «Mejora de la comprensión del lenguaje mediante el entrenamiento previo generativo» (Improving Language Understanding by Generative Pre-Training). Este fue el inicio de GPT.
No hizo falta mucho tiempo para que los modelos de lenguaje basados en transformadores demostraran ser capaces de aprender patrones complejos en el lenguaje natural gracias a un entrenamiento previo con grandes cantidades de datos de texto. También son capaces de generar textos coherentes y proporcionar respuestas útiles a una variedad de entradas.
La primera versión de GPT fue lanzada en junio de 2018. Este modelo demostró ser muy efectivo en tareas de procesamiento del lenguaje natural, como la generación de texto, la traducción automática o la clasificación de texto, entre otras. A pesar de ello, se dieron cuenta que esta primera versión tenía grandes limitaciones. Por ejemplo, a veces producía resultados incoherentes o irrelevantes. Mucho peor era el hecho de que no había manera de controlar o guiar el contenido que producía. Esto suponía un alto riesgo de generar contenido inapropiado, sesgado o potencialmente dañino.
Ilya Sutskever: «Habíamos descubierto la fórmula para el progreso, la fórmula que todos perciben ahora: el oxígeno y el hidrógeno del aprendizaje profundo es la computación con una gran red neuronal y datos«.
Qué es GPT
GPT utiliza redes neuronales con la arquitectura Transformer en combinación con técnicas de aprendizaje no supervisado y de pre-entrenamiento masivo con grandes cantidades de texto. La capacidad de atención del Transformer identifica las relaciones de largo alcance en el texto (palabras relacionadas que no están cercanas en el texto de entrada), lo que le permite generar texto coherente y relevante en una variedad de tareas de procesamiento de lenguaje natural.
Dicho de otra forma, GPT es un software que tiene la capacidad de aprender patrones y estructuras del lenguaje humano mediante el entrenamiento previo con grandes cantidades de datos de texto. A partir de aquí, puede generar textos con respuestas coherentes como respuesta a las entradas de su usuario.
Para entrenar el modelo GPT, OpenAI utilizó una gran cantidad de textos de internet, incluyendo libros, artículos de noticias, sitios web y otros muchos documentos. También se utilizó un método de entrenamiento autodirigido conocido como «aprendizaje por refuerzo». Este método permite que el modelo pueda mejorar de forma continua en su capacidad de generar respuestas apropiadas.
La versión original de GPT (GPT-1, de junio de 2018) se entrenó en un conjunto de datos de texto de 40 GB y tiene 117 millones de parámetros. Desde entonces, se han creado modelos mejorados con un número cada vez mayor de parámetros y entrenados con conjuntos de datos más grandes. El conocido como GPT-2 (febrero de 2019) utiliza 1.500 millones de parámetros, GPT-3 (junio de 2020) utiliza 175 mil millones de parámetros y GPT-4 (2023) utiliza 100 millones de millones de parámetros (1014). Cada una de estas versiones mejoran considerablemente su capacidad para ofrecer respuestas coherentes en una dinámica de conversación natural.
Qué es ChatGPT
En 2019, OpenAI decidió que era el momento de comercializar GPT. Para ello, creó una API que permitía interconectar aplicaciones de terceros con su software de inteligencia artificial. Una API es un pequeño código que hace de intermediario entre ambos. La API permite controlar la identidad del que accede y su actividad, así como cobrar por ello. Por tanto, se trata de un acceso restringido y controlado.
OpenAI tenía un cierto temor a que GPT pudiera ser utilizado para generar contenido malicioso o engañoso. Esto les llevó a tomárselo con calma y vigilar el comportamiento de su software en un uso externo intenso pero controlado. En mayo de 2020 adaptaron la API para conectarla con GPT-3.
Después de este periodo de aprendizaje, en noviembre de 2022, se atrevieron a abrir su servicio al público general. Para ello, crearon una página web que hiciera de intermediaria con GPT. A este servicio lo llamaron ChatGPT. Los usuarios podrían mantener conversaciones con GPT en modo de texto a través de esta web: https://chat.openai.com.
El servicio ChatGPT es lo que se conoce como un chatbot lúdico. Esto es, es una máquina, un software, con la que se puede hablar. Un robot que conversa. La particularidad es que ha sido entrenado con todo el conocimiento de internet, por lo que puede responder a cualquier tipo de pregunta. El hecho es que nos ha permitido que podamos acceder a respuestas rápidas, pedir explicaciones de conceptos complejos y servir de inspiración en la generación de ideas. No está exento de desafíos éticos y sociales, pero aporta una gran utilidad.
Para el público general, ChatGPT supuso descubrir el potencial de la inteligencia artificial. A la vez, empezamos a ser conscientes del gran riesgo potencial que tiene esta tecnología.
Si le interesa saber más sobre ChatGPT, puede consultar el artículo Qué es ChatGPT y cómo funciona.
Dall-e. Convertir textos en imágenes
Una vez desarrollado el potencial del modelo transformador para la generación de textos, se abría la posibilidad de que este modelo pudiera ser utilizado para generar otro tipo de contenidos. OpenAI vio el potencial de la IA para generar imágenes creativas y originales. Imágenes que podrían ser utilizadas en una variedad de campos como el arte, el diseño o la publicidad.
En el año 2020, se crea un equipo de investigación liderado por Ilya Sutskever y Greg Brockman. Se trata del proyecto Dall-E. Su objetivo era desarrollar un sistema capaz de generar imágenes a partir de descripciones de texto. Esta herramienta permitiría a cualquier persona crear imágenes originales, independientemente de sus habilidades artísticas.
Dall-E utilizaba el modelo GPT-3 para codificar la descripción textual del usuario en una representación matemática. Posteriormente, esta expresión matemática se utiliza para generar una imagen. El sistema es similar al utilizado por el modelo de lenguaje natural, pero adaptado para trabajar con datos de imágenes.
El modelo de Dall-E fue entrenado con un gran conjunto de datos de imágenes y textos asociados, lo que le permitió aprender a asociar descripciones de texto con imágenes específicas y generar imágenes que reflejen las descripciones dadas. El resultado: Dall-E se convirtió en el primer sistema avanzado capaz de crear imágenes a partir de descripciones de texto.
Después de la primera versión experimental terminada en enero de 2021 (imágenes con una resolución de 256×256 píxeles), vino una segunda versión (Dall-E 2, lanzada en abril de 2022) que ofrecía una mayor calidad de imagen (resolución de 1024×1024 píxeles) y un mayor control para la generación de la misma. Esta versión se abrió al público a través de un sistema de créditos. La versión Dall-E 3 permite realizar ediciones más precisas a las imágenes y se encuentra disponible para usuarios de pago de OpenAI (profesionales) y a través de Bing Chat (público general).
Codex. Convertir textos en código
Lo cierto es que el número de aplicaciones que pueden ser desarrolladas utilizando las redes neuronales son potencialmente ilimitadas. Se han creado modelos que generan vídeo a partir de textos u otras que modifican un vídeo para hacer que sus personajes hablen en otros idiomas. Lo curioso de todo esto es que estamos en los comienzos de esta tecnología.
Por poner otro ejemplo de los desarrollos que está haciendo OpenAI. En 2022 creó el servicio Codex. Se trata de una aplicación que es capaz de general código software funcional a partir de las descripciones en lenguaje natural de su usuario. El servicio Codex supone varias contribuciones significativas en el campo de la programación:
- Permite que los no profesionales puedan acceder a la programación. Codex permite a personas sin experiencia en programación crear códigos simplemente utilizando descripciones en lenguaje natural. Esto amplía el acceso a la programación y facilita la participación de personas de diferentes campos en el desarrollo de software.
- Facilita el aprendizaje de programación. Codex puede ayudar a los principiantes a comprender mejor los conceptos de programación y su sintaxis. Puede proporcionar ejemplos y sugerencias de código en tiempo real, lo que permite que los estudiantes desarrollen sus habilidades de programación de una manera más efectiva.
- Aceleración del desarrollo profesional de software: Codex puede generar código rápidamente, lo que acelera el proceso de desarrollo de software y reduce los tiempos de entrega de proyectos. Esto puede ser especialmente útil para profesionales que trabajan en entornos con cortos plazos de entrega.
A diferencia de Dall-E, Codex no fue el primer servicio de este tipo que se ponía en el mercado. Algunos ejemplos anteriores destacados fueron Kite (2016) o TabNine (2018). A pesar de no ser el primero, mientras que los anteriores eran servicios de autocompletado, Codex destacó por su capacidad para generar código a partir de descripciones en lenguaje natural, así como por su integración con GitHub.
Modelo de negocio de OpenAI
Inicialmente, OpenAI se estableció como una organización sin fines de lucro con un enfoque en la investigación y el desarrollo de soluciones de inteligencia artificial. Sus inversores iniciales se conformaban con la finalidad humanista del proyecto. No obstante, pronto se dieron cuenta de que el costo y la complejidad de los proyectos de IA requerían recursos financieros significativos a largo plazo.
La solución que se les ocurrió en 2019 fue dejar de ser una organización sin fines lucrativos para convertirse en una empresa con ánimo de lucro limitado (OpenAI LP). Con esta limitación se comprometía a establecer un límite de ganancias de cien veces la inversión realizada. Esto le permitió a OpenAI buscar otro tipo de inversores, colaboraciones comerciales y otras fuentes de financiación que les ayudara a respaldar sus operaciones. Esta transición también les facilitó el poder ofrecer productos y servicios basados en su tecnología, lo que generaría ingresos adicionales para la organización. A pesar de ello, OpenAI ha reafirmado su compromiso humanista en el desarrollo de la IA.
Como complemento de lo anterior, OpenAI firmó en 2019 un acuerdo de financiación con Microsoft de 1.000 millones de dólares. Este acuerdo le otorgaba a Microsoft una licencia comercial exclusiva para distribuir los productos de OpenAI. El acuerdo con Microsoft le permitió aumentar sus recursos técnicos y humanos y ampliar su enfoque para incluir el desarrollo de productos y servicios comerciales.
Actualmente, OpenAI ofrece sus servicios en una modalidad gratuita limitada y otra de pago (por ejemplo, ChatGPT Plus). Para hacernos una idea, las ventas de 2023 superaron los 1.600 millones de dólares. Es lo que tiene ser una empresa global desde el primer día. Si tiene interés en consultar sus precios, esta es su web: precios de OpenAI.
Por cierto, en 2018 Elon Musk dejó la junta directiva de OpenAI, según él, para evitar un conflicto de intereses con Tesla. No obstante, según Sam Altman, Musk creía que OpenAI se había quedado atrás de otros competidores, como Google, y sugirió hacerse cargo de OpenAI. Como la junta se negó, Musk decidió abandonar la empresa.
En 2021 se firmó un nuevo acuerdo de colaboración con Microsoft en el que OpenAI tendría acceso a la infraestructura de supercomputación de Azure. Por otro lado, ambas empresas podrían comercializar de forma independiente las tecnologías de IA resultantes. Este acuerdo se renovó en enero de 2023, lo que le permitió a Microsoft incorporar la tecnología de GPT en Microsoft Bing, Edge y Microsoft 365, entro otros productos.
Aunque no trascendieron muchos detalles concretos de este último acuerdo, se dice que suponían una inversión por parte de Microsoft de 10.000 millones en varios años. La estructura del acuerdo supondría una inyección de capital y el uso de Azure. Como contrapartida, Microsoft tendría derecho a quedarse con el 75% de las ganancias de OpenAI hasta que recupere la inversión. A continuación, Microsoft se quedaría con el 49% de los beneficios de la empresa. Además, OpenAI ayudaría a Microsoft a desarrollar su supercomputadora Azure AI (Azure AI Supercomputing).
¿Cómo una empresa que prometió permanecer libre de patentes, de código abierto y totalmente transparente, terminó otorgando una licencia exclusiva de su tecnología a la empresa de software más grande del mundo?
No hay que olvidar que OpenAI nació como una empresa sin ánimo de lucro. Hablar de acuerdos comerciales y de exclusividades en ese entorno supone bordear los límites éticos de los objetivos de la entidad. Para algunos miembros del Consejo de Administración, estos acuerdos son claramente criticables. Tiene implicaciones éticas (se pierde el control de uso de la tecnología, que podría utilizarse con fines contrarios a la ética de OpenAI), implicaciones en el control y acceso a la tecnología (da ventajas en exclusiva a una empresa, limitando la competencia) y tiene un impacto en la comunidad de investigación (riesgo de disminución de la colaboración abierta o que Microsoft se quede con los mejores talentos).
La validez de estas críticas es un tema de debate y análisis, y no existe una opinión única al respecto, pero en OpenAI provocaron una crisis con gran repercusión mediática.
El liderazgo de Sam Altman
El éxito de una organización depende principalmente del equipo humano que la forma. Pero ese equipo hay que dirigirlo y orientarlo adecuadamente para conseguir los objetivos de forma exitosa. Sam Altman no solo es uno de sus fundadores, sino que desde el principio dirigió las actividades de la empresa como CEO y presidente del Consejos de Administración. Sin duda, Altman ha desempeñado un papel de liderazgo clave en la supervisión y la toma de decisiones estratégicas de la organización.
Para quien no lo sepa, los consejos de administración de las empresas (llamados también juntas directivas) suelen supervisar las actividades que realiza el CEO (o director ejecutivo). En el caso de OpenAI, los miembros del Consejo no siempre estaban de acuerdo con Altman. OpenAI nació como una empresa ética y responsable. Había quien pensaba que Altman no siempre respetaba estos compromisos. Por su parte, Altman prefería interpretar los principios con una cierta flexibilidad a cambio de garantizar la supervivencia de la empresa y el cumplimiento de sus objetivos últimos: el desarrollo de la IA.
El hecho es que el 17 de noviembre de 2023 estalló la sorpresa. El Consejo de Administración despidió a Altman alegando que «no siempre fue sincero en sus comunicaciones«. Se formó un gran revuelo mediático. Todos los actores interesados (Microsoft, miembros del consejo, empleados, etc.) se pronunciaron al respecto. Tres días más tarde, el 20 de noviembre, más de 500 empleados (de unos 700) firmaron una carta amenazando con dejar la empresa si no dimitía todo el consejo de administración y traían de vuelta a Altman. Esto puso fin de la discusión. El 21 de noviembre Altman volvió como CEO y se renovó todo el Consejo de Administración.
Esto pone de manifiesto que Sam Altman ha sido y sigue siendo un líder inspirador que ha sabido crear un entorno donde los mejores investigadores del mundo querían trabajar. Sin él, trabajar en OpenAI no era lo mismo.
Independientemente de lo anterior, no cabe duda tampoco de que el éxito de OpenAI es el resultado del trabajo conjunto de un equipo talentoso y diverso de personas. En este sentido, podemos destacar el equipo de investigación y desarrollo, que incluye a figuras destacadas como Ilya Sutskever, Greg Brockman o Wojciech Zaremba. Estos investigadores y científicos han liderado la creación y el avance de modelos de IA revolucionarios como GPT y DALL-E. Por su parte, Mira Murati fue vicepresidenta de investigación de OpenAI. Murati ha sido una figura clave en la dirección de la investigación de la empresa y ha contribuido a la creación de algunos de sus proyectos más innovadores, como Dall-E.
En octubre de 2023, OpenAI estaba valorada en 80.000 millones de dólares.
Conclusiones sobre la historia de OpenAI
La historia de OpenAI es una epopeya que refleja la ambición por el conocimiento y la visión de un grupo de científicos y emprendedores inspirados por el potencial transformador de la inteligencia artificial. Desde sus inicios en 2015, la organización ha avanzado a pasos agigantados, estableciéndose como un faro de innovación en el campo de la IA. Inspirados por el éxito de DeepMind y motivados por un deseo compartido de promover una IA benéfica y responsable, los fundadores de OpenAI sentaron las bases para una organización que cambiaría el panorama de la investigación y el desarrollo de IA.
La creación de plataformas como OpenAI Gym ha democratizado el acceso a herramientas de entrenamiento de algoritmos de IA, permitiendo a investigadores y desarrolladores de todo el mundo colaborar y avanzar en este campo. El lanzamiento de modelos revolucionarios como GPT, DALL-E o Codex ha llevado la IA a nuevas alturas, desafiando los límites de lo que es posible en términos de comprensión del lenguaje natural, generación de imágenes o programación asistida por IA.
Sin embargo, el camino de OpenAI no ha estado exento de controversias. Los acuerdos con Microsoft han generado críticas por la posible exclusividad y el uso comercial de la tecnología. La falta de transparencia y la concentración de poder en manos de unas pocas empresas también han sido objeto de debate. A pesar de ello, estos acuerdos han proporcionado recursos adicionales para que OpenAI pueda seguir avanzando en su misión.
Pese a los desafíos, OpenAI continúa liderando la carrera hacia la inteligencia artificial. El liderazgo de Sam Altman ha sido fundamental para el éxito de la empresa, y todos esperamos que su visión de un futuro donde la IA beneficie a toda la humanidad siga siendo la brújula que guía su camino.
La historia de OpenAI aún está en desarrollo, pero ya ha dejado una huella imborrable en el mundo.
Ilya Sutskever: “Tenemos una transformación tecnológica de una magnitud tan gigantesca y catastrófica que, incluso si todos hacemos nuestra parte, el éxito no está garantizado. Pero si todo sale bien, podremos tener una vida increíble”.
Más información sobre IA y emprendimiento
La inteligencia artificial y el emprendimiento son temas apasionante que da para muchas historias. Si busca inspiración o simplemente le interesan estos temas, en este blog se dispone de muchos otros contenidos relacionados. Por favor, utilice el buscador de contenidos que tenemos en la cabecera.
Por otro lado, estos son algunos otros artículos que pueden ser de interés:
Hola me pareció interesante su articulo. Pero me gustaría saber la bibliografía; para saber de donde proviene toda la información.
Saludos
Muchas gracias Eduardo por el comentario y la pregunta. A pesar de que los contenidos de este blog son fundamentalmente divulgativos, nos tomamos muy en serio la verificación de los datos que se incluyen. Los contenidos son el resultado de un lento trabajo de investigación en fuentes oficiales, fuentes periodísticas, publicaciones científicas, artículos y reportajes. Este es el motivo por el que las historias de este modesto blog son frecuentemente señaladas por sus protagonistas como fidedignas (con OpenAI no hemos tenido la oportunidad).
No obstante, es un blog divulgativo sin ánimo de lucro, por lo que tenemos que hacerlo de la forma más austera posible. Esto supone no utilizar tiempo para referenciar cada una de las afirmaciones que se incluyen. En cualquier caso, con el ánimo de aportar una respuesta más concreta, le indico algunas de las fuentes utilizadas:
– El sitio web oficial de OpenAI: https://openai.com
– La página de Wikipedia en español sobre OpenAI: https://es.wikipedia.org/wiki/OpenAI así como la más amplia en inglés: https://en.wikipedia.org/wiki/OpenAI
– Otras enciclopedias como https://www.britannica.com/money/OpenAI
– y una infinidad de artículos periodísticos como: https://www.forbes.com/sites/bernardmarr/2023/05/19/a-short-history-of-chatgpt-how-we-got-to-where-we-are-today/, https://techcrunch.com/2023/11/21/a-brief-look-at-the-history-of-openais-board/ o https://www.technologyreview.com/2023/03/03/1069311/inside-story-oral-history-how-chatgpt-built-openai/
entre otras muchas.
Muchas gracias de nuevo por su aportación y reciba un saludo cordial.