¿Pueden los proveedores entrenar la IA con los datos de una empresa?
Los modelos de inteligencia artificial generativa se entrenan con enormes conjuntos de datos, lo que incentiva a las empresas que los crean y mejoran a recopilar la mayor cantidad de datos e información posible. Este incentivo ha llevado a algunos proveedores de servicios a explorar todas las vías posibles de recopilación de datos, incluidos los proporcionados por sus propios clientes. ¿Deberían los clientes, ya sean empresas que utilizan software o servicios de terceros para gestionar aspectos clave o secundarios de su negocio, preocuparse por la privacidad de sus datos o simplemente por que otra empresa los monetice?
Las decisiones judiciales no han resuelto el problema.
Lamentablemente, las recientes decisiones judiciales no ofrecen mucha orientación sobre estas cuestiones emergentes. Los dos casos más recientes de gran repercusión relacionados con la propiedad intelectual y la inteligencia artificial son Bartz v. Anthropic (2025) y Kadrey v. Meta Platforms (2025). En ambos, los demandantes interpusieron demandas contra empresas que utilizaron su información protegida por derechos de autor para entrenar sus modelos de IA. Los tribunales fallaron a favor de los demandados en ambos casos. Sin embargo, los demandantes eran autores literarios. Por lo tanto, la mayor parte de los argumentos se centraron en si el uso de estos materiales se consideraba uso legítimo, un criterio utilizado para determinar la legitimidad de una reclamación por infracción. En ambos casos, los tribunales determinaron que el grado en que los modelos de inteligencia artificial "transformaron" los datos con los que se entrenaban en un resultado completamente nuevo y único era tan significativo que el uso prevalecía sobre la reclamación de derechos de autor de los autores. En términos más sencillos, aunque la IA se entrene con material protegido por derechos de autor, la obra resultante es tan diferente de la obra con la que se entrenó que el uso de material protegido por derechos de autor para entrenar el modelo constituye un uso legítimo.
Sin embargo, es importante señalar que estos casos no sientan un precedente que avale de forma generalizada el uso de la propiedad intelectual para entrenar modelos de IA. Por el contrario, el juez en el caso Kadrey señaló que es posible que los modelos de IA entrenados con información protegida por derechos de autor produzcan resultados menos transformadores que los presentados en dicho caso. El juez añadió que, de haber conocido esos casos, probablemente habría fallado a favor de los demandantes.
Sin embargo, las decisiones relativas al poder transformador de la IA no resuelven las preocupaciones que una empresa pueda tener sobre su información confidencial. La situación se complica cuando la propiedad intelectual en cuestión no son obras publicadas de un autor, sino información personal o confidencial. Consideremos el siguiente caso: el propietario de un complejo de apartamentos contrata a un tercero para gestionar parte de sus finanzas, las cuales implican información confidencial de los inquilinos. Este tercero utiliza la información proporcionada por el complejo para entrenar sus modelos de IA y así ofrecer un mejor servicio al propietario. ¿Se han vulnerado los derechos del propietario? La respuesta no está del todo clara.
La misma pregunta puede aplicarse a la información identificable o confidencial. Un argumento es que, siempre que el resultado producido esté suficientemente distorsionado y anonimizado como para no constituir la divulgación de información privilegiada, aparentemente no habría problema. Un contraargumento es que, incluso si la información está anonimizada, la gran capacidad de la IA podría permitir a un tercero reconstruir los datos anonimizados. Otro contraargumento es que el proveedor acordó contractualmente utilizar los datos del cliente únicamente para prestarle servicios, no para mejorar su propio producto o servicio.
El lenguaje contractual puede resolver el problema.
Existe una solución alternativa a esperar a que los tribunales decidan sobre este asunto: incluir el tratamiento de los datos en el contrato entre el proveedor y el cliente. La inclusión de la cláusula contractual pertinente beneficiará a ambas partes, ya que, al igual que otras disposiciones contractuales, la claridad en cuanto a los derechos y obligaciones de las partes reduce la probabilidad de un litigio. La naturaleza de las cláusulas relacionadas con la IA puede variar según los intereses de las partes, desde el uso de los datos del cliente para mejorar el producto del proveedor hasta la prohibición de su uso para entrenar el modelo de IA del proveedor. Dependiendo de la naturaleza de los datos y las preocupaciones del cliente, las cláusulas pueden incluir indemnización, derechos de auditoría, garantías de seguridad, la obligación de eliminar los datos del cliente al finalizar la relación y penalizaciones.
Próximos Pasos
Los clientes deben mantenerse alerta sobre el uso que se le da a la información que proporcionan a sus proveedores por múltiples razones (para garantizar la confidencialidad, para poder estructurar sus contratos con los proveedores de manera que estos no utilicen su propiedad intelectual para entrenar sus modelos de IA, para asegurarse de que sus proveedores no obtengan beneficios indebidos de sus datos sin ofrecer una compensación adecuada, etc.). Los proveedores deben estar al tanto de las decisiones judiciales más recientes relacionadas con estos temas y tener en cuenta lo que estipulan sus propios contratos para evitar costosos litigios, acciones legales punitivas y, lo que es igual de importante, dañar sus relaciones con los clientes. Al igual que la propia IA, las leyes y las decisiones judiciales sobre IA cambiarán rápidamente.