Please disable Ad Blocker before you can visit the website !!!

Google y OpenAI planean tecnología para rastrear contenido generado por IA

by Admin1976   ·  julio 22, 2023   ·  

[ad_1]

El auge de la IA plantea muchas preguntas urgentes para los creadores de contenido y la industria de los medios. Uno de los más fundamentales es este: ¿cómo podemos distinguir imágenes, videos o piezas de música generados por IA de las creaciones humanas? Cuando el presidente Biden anunciado ayer que siete importantes empresas de tecnología estaban tomando medidas voluntarias para regular sus tecnologías de IA, surgió una posible respuesta: la marca de agua digital. GoogleGOOG
y IA abierta en particular, se comprometió a desarrollar esquemas de marcas de agua para ayudar a identificar el contenido creado con sus herramientas de IA.

La marca de agua digital toma su nombre de técnicas centenarias para incrustar marcas invisibles en el papel para indicar su origen y autenticidad, marcas que podrían verse si el papel estuviera empapado en algún líquido. La mayoría de los billetes de hoy, por ejemplo, contienen varios tipos de marcas de agua. En la marca de agua digital, un algoritmo opera en un archivo de contenido digital (una imagen JPEG, un archivo de audio MP3, un archivo de video MP4) para insertar una pequeña porción de datos de una manera que no afecte la forma en que un usuario los verá o los escuchará. Puede ejecutar un programa de software en el archivo para extraer ese pequeño dato, que se denomina carga útil.

Esta tecnología no es nueva ni rara. Las técnicas de marca de agua digital aparecieron por primera vez en la década de 1990. Se utilizan de forma rutinaria en muchos tipos de contenido hoy en día, desde películas que se muestran en los cines hasta fotos de agencias de valores, libros electrónicos y archivos de música digital que se venden en línea. En la mayoría de los casos, se utilizan para rastrear los orígenes del contenido que se sospecha que está pirateado. Herramientas de creación de contenido hoy en día como AdobeADBE
Photoshop tiene complementos que permiten a los usuarios incrustar marcas de agua invisibles.

Un buen algoritmo de marca de agua hace que la carga útil sea muy difícil de eliminar sin dañar el contenido y lo suficientemente sólida como para sobrevivir a transformaciones como capturas de pantalla de imágenes o grabaciones analógicas de música digital. Como resultado, la capacidad de datos de la carga útil de una marca de agua es muy pequeña, por lo general unas pocas docenas de bytes, por lo que no es posible incluir mucha información útil en una marca de agua. En cambio, la carga útil suele ser un identificador que se usa para indexar una entrada en una base de datos, donde se puede almacenar información sobre el contenido.

Eso lleva al uso de marcas de agua en IA. Las herramientas de IA generativa se pueden modificar fácilmente para que incrusten una marca de agua cuando producen una pieza de contenido. La carga útil puede apuntar a una entrada en un registro en línea que almacena información como el nombre de la herramienta de IA, la fecha y la hora, la identidad del usuario que la usó y quizás información sobre cómo o si el usuario estuvo involucrado en la creación del contenido. Esta última información es importante, por ejemplo, para determinar si el usuario califica como «autor» del contenido bajo la ley de derechos de autor. Los proveedores de herramientas de IA pueden hacer que las herramientas de extracción de marcas de agua estén disponibles gratuitamente para el público para que puedan examinar cualquier contenido que encuentren para ver qué orígenes de IA puede tener, si es que tiene alguno. Estas herramientas serían como “gafas de visión de rayos X” para mirar el contenido y encontrar información sobre él.

Este uso de la marca de agua es similar a una iniciativa existente llamada Iniciativa de autenticidad de contenido (CAI), que Adobe inició en 2019. El CAI se diseñó originalmente para rastrear el origen y la procedencia del contenido, en particular el contenido de noticias, para distinguirlo de la desinformación; la membresía del CAI incluye organizaciones periodísticas como AP, New York TimesNYT
y BBC. Adobe anunció recientemente que agregará a sus aplicaciones de edición de imágenes la capacidad de registrar el uso de IA generativa, como Firefly de Adobe, en sus herramientas CAI.

Sin embargo, aunque la tecnología existe, los desafíos están por venir. Una es que los esquemas de marcas de agua difieren de un tipo de contenido (p. ej., imágenes) a otro (p. ej., música). Otra es que no existen algoritmos de marca de agua estándar, incluso para tipos de contenido específicos. Varios proveedores tienen cada uno sus propios esquemas patentados. Existe lo que los expertos en propiedad intelectual denominan una “maraña de patentes” en la tecnología: existen muchas patentes relacionadas con las marcas de agua, algunas de las cuales son propiedad de empresas que las mantienen continuamente y las utilizan para cobrar tarifas de licencia, como amenazar o presentar demandas por infracción de patente. No sería posible crear estándares para los esquemas de marcas de agua que utilizan todos los proveedores de herramientas de creación de contenido de IA sin embarcarse en un proceso largo y polémico que implica la identificación y concesión de licencias de patentes.

Esto significa que, en el futuro previsible, lo más probable es que cada proveedor de herramientas de IA tenga que desarrollar su propio esquema de marcas de agua y tomar sus propias decisiones sobre la responsabilidad de patentes y las licencias de tecnología. Como resultado, sería necesario utilizar varios juegos de «gafas de visión de rayos X» para encontrar marcas de agua en el contenido.

También sería posible que los proveedores de tecnología de IA se reúnan en un formato estándar para los datos de carga útil e incluso en un registro común (base de datos) para almacenar la información a la que apuntan las cargas útiles. En 2009, la RIAA creó un carga útil de marca de agua estándar para archivos de música que fue diseñado para funcionar con múltiples esquemas de marcas de agua de audio.

Estas empresas de tecnología de inteligencia artificial deberían seguir el camino de los formatos de carga útil estándar, un registro común y herramientas de detección de marcas de agua disponibles gratuitamente. Este es el mejor lado de la regla 80/20 cuando se trata de estandarizar esta tecnología para el bien de todos en un tiempo razonable, y el tiempo es esencial aquí. Este tipo de establecimiento de estándares permitirá que otros proveedores de tecnología de IA, incluida la multitud de nuevas empresas por venir, se unan fácilmente.

Hay muchas buenas razones para identificar el contenido generado por IA y distinguirlo del contenido creado por humanos e incluso del contenido creado por personas con asistencia de IA. Es probable que la IA conduzca a una explosión de contenido que empequeñece lo que los humanos han creado, incluso con las poderosas herramientas digitales que tenemos hoy. Por ejemplo, la semana pasada, la startup de música con inteligencia artificial Mubert se jactó de que su tecnología ha creado más de 100 millones de pistas, igual al tamaño de toda la biblioteca de Spotify. Y aunque Mubert no ha intentado subir toda esa música a Spotify, otra startup de música de IA llamada Boomy hizo precisamente eso, y Spotify tomó medidas para eliminarlo. Esto es solo una escaramuza en lo que seguramente será un largo proceso de disrupción para la música y otros tipos de contenido, y el resultado está lejos de ser claro.

Por supuesto, el uso de marcas de agua para identificar contenido generado por IA sería voluntario; Los proveedores de tecnología de inteligencia artificial que se niegan a usar marcas de agua son inevitables, incluso si la tecnología es de uso gratuito. (Y, por supuesto, los piratas informáticos buscarán formas de eliminar las marcas de agua de IA sin alterar el contenido). Eso lleva a la necesidad de identificar el contenido generado por IA después de su creación.

Esta tecnología existe hoy en día como una rama de herramientas para detectar plagio en tareas escritas en escuelas y universidades. Otras empresas están desarrollando tecnología para detectar contenido visual y de audio generado por IA, principalmente con el objetivo de erradicar las falsificaciones profundas. Esto conducirá inevitablemente a una carrera armamentista entre las herramientas de detección de IA y las herramientas de creación de contenido de IA. Y a medida que crezcan las necesidades comerciales de detección de contenido de IA, por ejemplo, si Spotify decidiera no aceptar ciertas formas de música generada por IA en su amplio catálogo, la carrera armamentista se acelerará.

Algunos dicen que detectar contenido generado por IA es una búsqueda quijotesca. Sin embargo, se dijeron cosas similares sobre la tecnología de reconocimiento de contenido para detectar música, texto y video con derechos de autor en línea en la década de 1990, tecnología que es análoga a la detección de IA en ciertos aspectos. Al principio, la tecnología de reconocimiento de contenido no era muy precisa, pero a medida que aumentó su necesidad con el aumento del intercambio de archivos en línea y la responsabilidad por derechos de autor, la tecnología mejoró, hasta el punto de que actualmente se usa todos los días en servicios como YouTube y Facebook. No es perfecto, pero funciona lo suficientemente bien como para satisfacer a los propietarios de los derechos de autor la mayor parte del tiempo. Lo mismo puede ocurrir con la detección de IA; tendremos que esperar y ver.

[ad_2]

Source link

Deja una respuesta