Blog

Nuestras publicaciones.

Buceando en las profundidades del ChatGPT

Nos adentramos hoy en el mundo de la Inteligencia Artificial y, en concreto, en una de las herramientas que está generando mayor controversia e impresión de los últimos meses. Como todos sabéis, estamos hablando de ChatGPT.

Nuestro objetivo es tratar de dar respuesta a las dudas más lógicas que se han generado en torno a esta herramienta, así como explicar en qué consiste en resumidas cuentas esta tecnología.

Antes de nada, debemos diferenciar la protección que tiene el sistema de OpenAI del contenido que se genera a través de esta tecnología.

Como no podía ser de otra manera, OpenAI ostenta los derechos de propiedad intelectual sobre su propio sistema. Y ello a través de (i) distintas patentes que protegen la tecnología subyacente de ChatGPT (entre otras, una técnica que utiliza ejemplos de texto estructurado -piénsese en una receta de cocina- para enseñar a una inteligencia artificial cómo entender el lenguaje natural); (ii) protección del código fuente mediante derechos de autor e inscripción en Registro de Propiedad Intelectual; y (iii) por supuesto, a través de medidas de confidencialidad para proteger el sistema.

No obstante, no es el objetivo de este artículo tratar la protección del sistema de OpenAI, sino conocer y discutir la autoría y protección del contenido generado por este sistema de Inteligencia Artificial.

Y lo haremos en formato preguntas:

1. ¿Qué es ChatGPT y por qué lo sabe casi todo?

ChatGPT es un modelo de lenguaje artificial que utiliza una red neuronal para procesar y comprender el lenguaje natural humano.

En palabras llanas, lo que hace ChatGPT es nutrirse de datos no estructurados para, mediante Inteligencia Artificial, ordenarlos para ser capaz de dar respuesta coherente (y por estadística), en lenguaje humano.

De esta forma, la tecnología GPT aprende patrones y regularidades en nuestro lenguaje. A más información, mayor capacidad de aprendizaje y mayor capacidad de dar respuesta coherente y correcta.

Para aprender y dar respuesta, ChatGPT se ha nutrido de información proveniente de la red, noticias, artículos y hasta de redes sociales.

2. Si ChatGPT me genera una poesía o un artículo, ¿esa poesía es una ‘obra’ con todo lo que ello conlleva a nivel de derechos de autor?

En España, se considera una obra susceptible de protección mediante derechos de autor aquella ‘creación original literaria, artística o científica expresada por cualquier medio o soporte’. La originalidad, en términos de propiedad intelectual, implica la manifestación de la personalidad del autor. Y ello conllevará siempre una actuación humana.

Podemos darle infinitas vueltas al asunto. No obstante, el literal del art. 10 de la Ley de Propiedad Intelectual expone: ‘1.- Son objeto de propiedad intelectual todas las creaciones originales literarias, artísticas o científicas expresadas por cualquier medio o soporte, tangible o intangible, actualmente conocido o que se invente en el futuro. 2.- A los efectos de esta Ley, se entiende por creaciones originales todas aquellas creaciones personales e individuales que sean originales por obra del ingenio.’

Además, es un hecho que jurisprudencialmente en España (y en la mayoría de países de derecho continental) se considera obra a la creación del intelecto humano. Diferente es en el derecho anglosajón.

Así, concluyo que con la legislación vigente no podremos considerar jamás como obra de propiedad intelectual el contenido generado por un sistema de Inteligencia Artificial sin actuación directa del ser humano.

Por ende, no podremos considerar autor a la tecnología de Inteligencia Artificial que elabore la obra. Y ello, a mi juicio, porque desnaturalizaría el sentido y bases de la propiedad intelectual. Todo ello no implica que podamos utilizar sin limitación el contenido que se genera en concreto por ChatGPT. A pesar de que es complicado concebirlo, concluímos que la poesía que genera ChatGPT no es una obra en términos de propiedad intelectual, dado que no ha sido elaborada por el ingenio humano.

3. Yo, que soy incapaz de escribir bien, ¿podría llegar a ser el autor de esa magnífica poesía?

Como hemos visto, si no hay obra, no hay autor. Por lo que, sintiéndolo mucho, tendrás que conformarte con tener algunos derechos de explotación del contenido que se genera con base en la licencia de OpenAI.

4. Si el contenido de la obra que genera íntegramente un sistema de IA no podemos considerarla protegible mediante derechos de autor, ¿la obra es de dominio público?

Efectivamente, concluimos que a priori la obra es de dominio público. No obstante, tenemos que considerar como hemos dicho antes que, en el caso que nos ocupa de ChatGPT, se trata de un sistema que está protegido como activo de propiedad industrial e intelectual y, como sistema informático, estaremos sujetos al acuerdo entre OpenAI (licenciante) y el usuario, a través de las condiciones del servicio.

5. Al hilo de lo anterior, ¿la utilización o explotación de esa poesía varía según la licencia suscrita?

Efectivamente, como usuario final -usuario estándar- ostentaremos una licencia de uso no exclusiva con algunas limitaciones. Entre ellas, la más importante es que no podremos darle un uso comercial a ese contenido. Otras son que no esté relacionado ese contenido con campañas políticas, contenido para adultos, spam, contenido de odio, contenido que incite a la violencia u otros usos que puedan causar daño social.

Para ostentar los derechos comerciales del contenido generado, deberemos suscribir con OpenAI una licencia de uso comercial. Y es aquí donde, entiendo, se basa el modelo de negocio de ChatGPT. Este sistema está concebido para ser integrado en otros sistemas a través de su API (Application Programming Interface). Una API es una interfaz de programación de aplicaciones que permite a diferentes aplicaciones y sistemas comunicarse entre sí de manera estandarizada. Para el común de los mortales, se trata de facilitar la integración de ChatGPT en otros sistemas, con el objetivo de darle un uso comercial al contenido generado por ChatGPT.

6. Por lo que dices, ¿puedo libremente utilizar ese contenido para generar un artículo en LinkedIn o presentar un trabajo en la universidad?

Sí, con ciertas limitaciones. La más importante es indicar que ese contenido ha sido generado por ChatGPT, aunque entiendo que eso es justo lo que se quiere evitar… Te recomiendo que leas la última pregunta. En otro caso, no podremos utilizar ese contenido.

7. ¿Y si lo modifico un poco? ¿Y si lo modifico mucho?

De nuevo, no obstante, estamos ante el muro de los términos de OpenAI, que exigen se deba dar ‘referencias y crédito adecuado’ en cualquier caso. Los buenos de Open AI nos sugieren este texto: ‘El autor generó este texto en parte con GPT-3, el modelo de generación de lenguaje a gran escala de OpenAI. Al generar el borrador del lenguaje, el autor revisó y editó el lenguaje a su gusto y asume la responsabilidad final del contenido de esta publicación.’

8. ¿Ha infringido OpenAI derechos de terceros al nutrir la tecnología GPT?

Si has entendido mínimamente -como yo- la tecnología de ChatGPT y la has probado, estoy absolutamente convencido de que te habrás preguntado cómo se ha recogido tal cantidad de información y datos.

OpenAI ha sido hasta cierto punto transparente, admitiendo que utilizó la técnica de web scrapping para entrenar a sus modelos de lenguaje, incluyendo GPT-3, que es la versión más avanzada de GPT. En un artículo publicado en agosto de 2020, OpenAI explicó el proceso de entrenamiento de GPT-3 y reconoció que utilizaron técnicas de web scraping para recopilar datos. El web scraping es el proceso de extracción automatizada de información de páginas web con la finalidad de almacenarlos y analizarlos.

Debo indicar que esta técnica plantea muchos problemas a nivel de privacidad y derechos de autor. Personalmente, es difícil creer que hayan filtrado únicamente aquellas fuentes donde se autoriza a practicar esta tecnología, habida cuenta de que se han tenido en cuenta más de 175 mil millones de piezas de información útiles para realizar conexiones neuronales dentro de la red neuronal.

Es por ello que ha generado mucha polémica, y muchos están acusando a OpenAI de haber sacado información protegida por derechos de autor sin el consentimiento de su titular.

9. Al utilizar ChatGPT, ¿puedo llegar a infringir derechos de terceros?

Sí, al haber sacado información y datos de diversas fuentes, es posible que se vulneren derechos de autor. De hecho, OpenAI anima a que el usuario se asegure de que no se están infringiendo derechos de terceros al utilizar el contenido que genera ChatGPT.

10. ¿Monitoriza OpenAI el contenido que se ha generado con ChatGPT?

Hola, estudiante. Efectivamente, OpenAI advierte de que puede utilizar sistemas de detección de contenido generado por Inteligencia Artificial. Desconocemos, por supuesto, hasta qué punto puede hacerlo.

Además, desde la misma organización han desarrollado un sistema de detección de textos generados por Inteligencia Artificial: ‘AI Text Classifier’. Debo decirte que se jactan de poder reconocer a través de esta herramienta de Inteligencia Artificial hasta el 26% de los textos generados por esta tecnología.

11. ¿Has dicho que OpenAI ha hecho web scraping de redes sociales…?

En otra publicación, hablaremos de las serias dudas que genera ChatGPT en el ámbito de la privacidad.

Hasta entonces, te animamos a que pruebes la herramienta a través de https://openai.com/blog/chatgpt.

David Amat

Natalia Tamames