🤖 SIA utilise l'intelligence artificielle
Conformément au Règlement européen sur l'Intelligence Artificielle (AI Act, Art. 50), nous vous informons que SIA intègre des systèmes d'intelligence artificielle dans ses fonctionnalités.
SIA est classé comme système d'IA à risque limité au sens de l'AI Act. Il ne prend aucune décision automatisée ayant un effet juridique. Toutes les décisions finales sont prises par l'utilisateur humain.
⚙️ Comment fonctionne SIA
Le principe : pseudonymiser avant de traiter
SIA ne transmet jamais vos données personnelles réelles à un modèle d'IA. Voici le processus :
- Vous saisissez votre texte — contenant potentiellement des données sensibles (noms, emails, IBAN, etc.)
- SIA pseudonymise automatiquement via un pipeline en 3 passes :
- Passe 1 : Détection par regex et validateurs français (IBAN, NIR, SIREN, SIRET, CNI, téléphone, email, etc.)
- Passe 2 : Détection par reconnaissance d'entités nommées (NER) avec spaCy
- Passe 3 : Ajout de bruit configurable sur les tokens
- Seul le texte pseudonymisé (ex:
{{NOM_a7b2}},{{EMAIL_xxxx}}) est envoyé au modèle d'IA - La réponse de l'IA est dé-pseudonymisée pour vous afficher le résultat final
Le mapping de correspondance (qui permet de relier les tokens aux données originales) ne quitte jamais le serveur SIA et est chiffré avec AES-256.
🧠 Modèles d'IA utilisés
| Modèle | Fournisseur | Utilisation | Données reçues |
|---|---|---|---|
| Gemini Flash | Chat par défaut | Texte pseudonymisé uniquement | |
| GPT-5.4 | OpenAI | Raisonnement avancé | Texte pseudonymisé uniquement |
| GPT-4o-mini | OpenAI | Résumés, titres | Texte pseudonymisé uniquement |
| Ollama / Phi 3.5 | Local | Alternative souveraine | Traitement 100% local |
| spaCy (fr_core_news_md) | Local | NER (Passe 2) | Traitement 100% local |
Vous pouvez demander l'utilisation exclusive de modèles locaux (Ollama) pour un traitement entièrement souverain, sans aucun transfert de données hors de France.
⚠️ Limites connues
- Hallucinations — Comme tout modèle d'IA, les LLM peuvent générer des informations incorrectes ou inventées. Vérifiez toujours les informations factuelles importantes.
- Biais linguistique — Le pipeline de pseudonymisation est optimisé pour le français. Les performances peuvent être réduites pour d'autres langues.
- Biais de nommage — Les noms d'origine non-européenne peuvent être moins bien détectés par le modèle NER (spaCy).
- Faux négatifs NER — Il est possible (rare) qu'une donnée personnelle ne soit pas détectée par le pipeline. La Passe 3 (bruit) constitue un filet de sécurité supplémentaire.
- Pas de conseil professionnel — SIA ne remplace pas l'expertise humaine en matière juridique, médicale ou financière.
🛡️ Supervision humaine
SIA est conçu pour maintenir un contrôle humain permanent :
- Vous pouvez vérifier le texte pseudonymisé avant tout envoi au modèle d'IA
- Vous pouvez corriger les pseudonymisations incorrectes
- Vous pouvez choisir de ne pas envoyer votre texte au LLM
- Vous pouvez sélectionner un modèle local (Ollama) pour zéro transfert de données
- Chaque opération est tracée cryptographiquement via le registre PoPR (Proof of Pseudonymization Record)
📜 Conformité réglementaire
| Réglementation | Statut | Mesures |
|---|---|---|
| AI Act (UE) | Système à risque limité | Transparence IA, identification chatbot, supervision humaine |
| RGPD | En conformité | Pseudonymisation, droits des personnes, politique de confidentialité |
| Cloud Act | Protection technique | Pseudonymisation 3 passes avant transfert, mapping local chiffré |