Transparence IA | SIA - Sécurité des IA

🤖 SIA utilise l'intelligence artificielle

Conformément au Règlement européen sur l'Intelligence Artificielle (AI Act, Art. 50), nous vous informons que SIA intègre des systèmes d'intelligence artificielle dans ses fonctionnalités.

🤖 Les réponses du chat SIA sont générées par des modèles d'IA. Vérifiez les informations importantes.

SIA est classé comme système d'IA à risque limité au sens de l'AI Act. Il ne prend aucune décision automatisée ayant un effet juridique. Toutes les décisions finales sont prises par l'utilisateur humain.

⚙️ Comment fonctionne SIA

Le principe : pseudonymiser avant de traiter

SIA ne transmet jamais vos données personnelles réelles à un modèle d'IA. Voici le processus :

Vous saisissez votre texte — contenant potentiellement des données sensibles (noms, emails, IBAN, etc.)
SIA pseudonymise automatiquement via un pipeline en 3 passes :
- Passe 1 : Détection par regex et validateurs français (IBAN, NIR, SIREN, SIRET, CNI, téléphone, email, etc.)
- Passe 2 : Détection par reconnaissance d'entités nommées (NER) avec spaCy
- Passe 3 : Ajout de bruit configurable sur les tokens
Seul le texte pseudonymisé (ex: {{NOM_a7b2}}, {{EMAIL_xxxx}}) est envoyé au modèle d'IA
La réponse de l'IA est dé-pseudonymisée pour vous afficher le résultat final

Le mapping de correspondance (qui permet de relier les tokens aux données originales) ne quitte jamais le serveur SIA et est chiffré avec AES-256.

🧠 Modèles d'IA utilisés

Modèle	Fournisseur	Utilisation	Données reçues
Gemini Flash	Google	Chat par défaut	Texte pseudonymisé uniquement
GPT-5.4	OpenAI	Raisonnement avancé	Texte pseudonymisé uniquement
GPT-4o-mini	OpenAI	Résumés, titres	Texte pseudonymisé uniquement
Claude Sonnet 4.6	Anthropic	Chat conversationnel	Texte pseudonymisé uniquement
Mistral Large	Mistral AI (France/UE)	Chat souverain UE	Texte pseudonymisé uniquement
Ollama / Phi 3.5	Local	Alternative souveraine	Traitement 100% local
spaCy (fr_core_news_md)	Local	NER (Passe 2)	Traitement 100% local

Vous pouvez demander l'utilisation exclusive de modèles locaux (Ollama) pour un traitement entièrement souverain, sans aucun transfert de données hors de France.

⚠️ Limites connues

Hallucinations — Comme tout modèle d'IA, les LLM peuvent générer des informations incorrectes ou inventées. Vérifiez toujours les informations factuelles importantes.
Biais linguistique — Le pipeline de pseudonymisation est optimisé pour le français. Les performances peuvent être réduites pour d'autres langues.
Biais de nommage — Les noms d'origine non-européenne peuvent être moins bien détectés par le modèle NER (spaCy).
Faux négatifs NER — Il est possible (rare) qu'une donnée personnelle ne soit pas détectée par le pipeline. La Passe 3 (bruit) constitue un filet de sécurité supplémentaire.
Pas de conseil professionnel — SIA ne remplace pas l'expertise humaine en matière juridique, médicale ou financière.

🛡️ Supervision humaine

SIA est conçu pour maintenir un contrôle humain permanent :

Vous pouvez vérifier le texte pseudonymisé avant tout envoi au modèle d'IA
Vous pouvez corriger les pseudonymisations incorrectes
Vous pouvez choisir de ne pas envoyer votre texte au LLM
Vous pouvez sélectionner un modèle local (Ollama) pour zéro transfert de données
Chaque opération est tracée cryptographiquement via le registre PoPR (Proof of Pseudonymization Record)

📜 Conformité réglementaire

Réglementation	Statut	Mesures
AI Act (UE)	Système à risque limité	Transparence IA, identification chatbot, supervision humaine
RGPD	En conformité	Pseudonymisation, droits des personnes, politique de confidentialité
Cloud Act	Protection technique	Pseudonymisation 3 passes avant transfert, mapping local chiffré