Le filigrane invisible SynthID de Google identifiera désormais le texte et les vidéos générés par l’IA, mais il est moins détectable lorsque le texte a été complètement réécrit ou traduit.

Google étend sa technologie de détection de contenu et de filigrane à deux nouveaux médias. La nouvelle version du système d’impression de filigrane SynthID peut désormais marquer les vidéos et le texte générés numériquement par les programmes Gemini AI de Google dans l’application Gemini ou sur le Web. Auparavant, l’outil SynthID permettait uniquement le filigrane des images et des sons générés par l’IA de Google. Le logiciel contribuera à répondre aux préoccupations concernant l’influence du contenu généré par l’IA lors des élections. OpenAI a également récemment lancé un outil capable de détecter les images créées par son logiciel DALL-E 3.

Alors que le contenu généré par l’IA commence à inonder Internet, le besoin de le détecter et de le distinguer s’est accru. L’une des principales solutions explorées par les entreprises est le filigrane. Le filigrane du contenu généré par l’IA deviendra de plus en plus important à mesure que la technologie gagnera en popularité, en particulier lorsque l’IA est utilisée à des fins malveillantes. L’IA est déjà utilisée pour générer et diffuser de la désinformation politique, faire croire que quelqu’un a dit quelque chose qu’il n’a pas dit et créer du contenu sexuel de célébrités sans leur consentement.

Cependant, les outils de filigrane étaient beaucoup plus faciles à développer pour les images que pour le texte. Mardi, Demis Hassabis, PDG de Google DeepMind, est monté sur scène pour la première fois lors de la conférence des développeurs Google I/O pour parler non seulement des nouveaux outils d’IA de l’équipe, comme le générateur vidéo Veo, mais également du nouveau système d’impression de filigrane SynthID. Ce système peut désormais marquer les vidéos générées numériquement ainsi que le texte généré par l’IA. Hassabis a fourni peu d’informations sur l’outil, mais un article de blog de l’entreprise note :

Envoyée par Google DeepMind

Aujourd’hui, nous étendons les capacités de SynthID pour filigraner le texte généré par l’IA dans l’application Gemini et l’expérience Web, ainsi que la vidéo dans Veo, notre modèle vidéo génératif le plus puissant.

SynthID for Text est conçu pour compléter la plupart des modèles de génération de texte IA disponibles et être déployé à grande échelle, tandis que SynthID for Video exploite notre méthode de marquage d’images et d’audio pour inclure toutes les images dans les vidéos générées. Cette méthode innovante permet d’incorporer un filigrane imperceptible sans affecter la qualité, la précision, la créativité ou la rapidité du processus de génération de texte ou de vidéo.

Pour les images, Google affirme avoir conçu le filigrane SynthID de manière à ce qu’il reste détectable même après qu’elles aient été modifiées en ajoutant des filtres, en changeant les couleurs ou en ajustant la luminosité. Et contrairement aux filigranes visibles, SynthID ne peut pas être supprimé par recadrage. Quant au contenu textuel, Google DeepMind explique brièvement que le fonctionnement de SynthID est basé sur la façon dont les grands modèles de langage (LLM) génèrent du contenu. Les LLM prédisent la phrase, le mot ou le caractère suivant en fonction de ce qui est le plus susceptible d’apparaître dans la séquence.

Les LLM génèrent des séquences de texte basées sur une question telle que « Expliquez-moi la mécanique quantique comme si j’avais cinq ans » ou « Quel est votre fruit préféré ? ». Les phrases, mots et caractères sont appelés « jetons » et chaque jeton se voit attribuer un score de probabilité. Google DeepMind explique :

Envoyée par Google DeepMind

Les jetons sont les éléments de base qu’un modèle génératif utilise pour traiter les informations. Dans ce cas, il peut s’agir d’un seul caractère, d’un mot ou d’une partie de phrase. Chaque jeton possible se voit attribuer un score, qui représente le pourcentage de chances qu’il soit le bon. Les jetons avec un score plus élevé sont plus susceptibles d’être utilisés. Les LLM répètent ces étapes pour construire une réponse cohérente.

SynthID est conçu pour intégrer des filigranes imperceptibles directement dans le processus de génération de texte. Pour ce faire, il introduit des informations supplémentaires dans la distribution des jetons au point de génération en modulant la probabilité de génération du jeton ; le tout sans compromettre la qualité, la précision, la créativité ou la vitesse de génération de texte.

Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, précise : « Il s’agit spécifiquement de modifier le contenu généré par l’IA afin qu’il reste détectable dans le futur. » Bien que Google affirme que « SynthID for text est compatible avec la plupart des modèles d’IA générateurs de texte », il reste à voir si ses concurrents, notamment OpenAI, Microsoft et Meta, l’adopteront ou créeront le leur. approches. En février, Meta a annoncé que la société commencerait à étiqueter les images générées par les modèles d’IA de concurrents tels qu’OpenAI, Google, Midjourney, Adobe et bien d’autres.

Meta a également appelé à l’adoption de normes pour étiqueter le matériel généré par l’IA. Nick Clegg, président des affaires mondiales chez Meta, a déclaré que le géant des médias sociaux collabore avec diverses entités, dont AI ​​Partnership (une organisation à but non lucratif composée d’universitaires, de professionnels de la société civile et de professionnels). organisations médiatiques dont l’objectif est de garantir que l’IA ait des résultats positifs pour les personnes et la société) pour développer des normes pouvant être utilisées pour identifier les images de l’IA sur le Web. OpenAI travaille également sur des outils similaires.

OpenAI a lancé plus tôt ce mois-ci un outil capable de détecter les images générées par son modèle d’IA de génération d’images DALL-E 3 pour répondre aux préoccupations concernant l’influence du contenu généré par l’IA sur les élections. La société a déclaré que l’outil identifiait correctement les images créées par DALL-E 3 environ 98 % du temps lors des tests internes et pouvait gérer les modifications courantes telles que la compression, le recadrage et les changements de format. saturation avec un impact minimal. OpenAI prévoit d’ajouter un filigrane inviolable pour marquer les photos ou les audios générés par l’IA.

Les filigranes sont encore limités et peuvent être supprimés en combinant différentes techniques. Google DeepMind affirme que le texte généré par l’IA avec son filigrane peut être détecté même en cas de « légère paraphrase », mais que le filigrane est moins détectable lorsque le contenu a été entièrement réécrit ou traduit. SynthID pour le texte est également moins efficace pour les documents factuels lorsqu’il y a peu de réponses possibles à une question donnée. La société prévoit d’ouvrir la technique de tatouage en Source libre cet été afin que d’autres puissent l’intégrer dans leurs services.

SynthID n’est pas une solution miracle pour identifier le contenu créé par l’IA, mais il constitue un élément important du développement d’outils d’identification de l’IA plus fiables et peut aider des millions de personnes à prendre des décisions éclairées concernant le contenu. comment ils interagissent avec le contenu généré par l’IA. “Cet été, nous prévoyons d’ouvrir SynthID pour le filigrane de texte, afin que les développeurs puissent utiliser cette technologie et l’incorporer dans leurs modèles”, explique Google DeepMind.

Source : Google DeepMind

Et toi ?

Quelle est votre opinion sur le sujet ?

Que pensez-vous de la nouvelle version de l’outil de filigrane SynthID ?

Sera-t-il efficace contre les abus de l’IA ? Que pensez-vous des limites de SynthID ?

Voir aussi

Google intègre des filigranes inaudibles appelés SynthID dans sa musique générée par l’IA, la protection contre la contrefaçon ne doit pas compromettre la vie privée des utilisateurs

Meta commencera à étiqueter les images générées par les modèles d’IA d’entreprises comme OpenAI et Google, et appelle à l’adoption de normes pour étiqueter le matériel généré par l’IA.

OpenAI ajoutera bientôt des filigranes aux images générées par DALL-E 3, l’adoption des normes C2PA est essentielle pour augmenter la fiabilité des informations numériques, selon OpenAI

 
For Latest Updates Follow us on Google News
 

PREV An Automation Adventure, une épopée faite de pierre, de bois et de magie
NEXT le luxe à petit prix ? – .