5.9 KiB
header-includes | ||||
---|---|---|---|---|
|
Semaine 6: La gestion de l'incertain dans les systèmes à base de connaissances
Systèmes à base de règles:
Référence: Managing Uncertainty in Rule-Based Systems
Types d'incertitude:
- Définition de l'antécédent de la règle
- Niveau de confiance en la règle
- Comment combiner les informations incertaines et le déclenchement de plusieurs règles
Méthodes pour gérer l'incertitude:
- Basées sur les probabilités
- Objeectives
- Valeurs bien définies pour un problème donné
- Jeux de hasard
- Expérimentales
- Obtenues par échantillonnage
- Développer des tables de probabilités pour les assurances
- Subjectives
- Basées sur une opinion d'un expert
- Objeectives
- Basées sur des heuristiques
- Approche préférée pour les systèmes à base de règles
- Nature inexacte des données
- Facteurs de certitudes: développés en premier pour MYCIN
- Logique floue: Zadeh (1965) - mots avec une signification ambigue
Systèmes à base de règles floues
Une règle est formée de variables linguistiques et de valeurs linguistiques. Les valeurs linguistiques sont associées à un ensemble flou. Un ensemble flou est caractérisé par une fonction d'appartenance prenant une valeur entre 0 et 1 pour chacune des valeurs numériques de la variable. Un ensemble flou peut aussi être discret.
- Pour les nouvelles valeurs de la variable qui ne sont pas définies dans l'ensemble discret:
- Interpolation
- Réseaux de neurones
Inférence en quatre étapes:
- Calcul des degrés d'appartenance
- Inférence par les règles:
- Union: Degré d'appartenance maximum pour toutes les conditions
- Intersection: Degré d'appartenance minimum pour toutes les conditions
- Couper la fonction d'appartenance à la hauteur spécifiée par la ondition de l'antécédent.
- Composition des règles
- Convertir l'ensemble flou en degrés de confiance
- Prendre la valeur maximum des règles
- Calculer le centre de gravité
Approche probabiliste
Théorème de Bayes:
P(H\mid E)={\frac {P(E\mid H)\,P(H)}{P(E\mid H)P(H)+P(E\mid \neg H)P(\neg H)}}\cdot
- Utilisé en premier dans le système expert PROSPECTOR
- Approche mathématiquement correcte
- Combinaison possible de plusieurs évidences. On peut simplifier les calculs en supposant l'hypothèse que les évidences sont conditionnellement indépendantes
Ratios de vraisemblance
- Vraisemblance de la suffisance (tend vers 1 signifie que E est suffisant pour affirmer H):
LS=\frac{P(E \mid H)}{P(E\mid\neg N)}
- Vraisemblance de la nécessité (tend vers 0 signifie que E est nécessaire pour affirmer H):
LN=\frac{P(\neg E \mid H)}{P(\neg E\mid\neg N)}
On peut utiliser ces ratios et le théorème de Bayes pour exprimer les deux règles suivantes:
P(H\mid E) = \frac{LS \times O(H)}{1+LS \times O(H)}
P(H\mid\neg E) = \frac{LN \times O(H)}{1+LN \times O(H)}
où
O(H) = \frac{P(H)}{P(\neg H)}
Pour utiliser dans un système à base de règles, on doit fixer une valeur de LN et de LS pour chaque évidence.
Enjeux
Problème de MYCIN: les experts n'étaient pas capables de faire sommer P(H \mid E) + P(\neg H \mid E) = 1
Hypothèses: Probabilités à priori, indépendance conditionnelle (approche forte ou naïve).
Besoin de beaucoup de données pour avoir un bon estimé des probabilité conditionnelles. Était un enjeu à l'époque, probablement moins aujourd'hui ce qui ramène les bases probabilistes à l'avant-plan et le machine learning avec des approches bayesiennes (Naive Bayes).
Systèmes à base de schémas probabilistes
Source: Probabilistic frame-based systems
- Intégration des réseaux bayesiens dans les systèmes de représentations par schémas.
- Annotation d'un schéma avec un modèle de probabilités. Réseau bayesien représentant la distribution des différents paramètres des terminaux du schéma.
- Utilisation du mécanisme d'héritage
- Incertitude structurelle
- Utilisation des facettes et des restrictions du domaine de valeurs. Peut être vu comme une généralisation des restrictions du domaine de valeurs en donnant la distribution de ce domaine de valeurs.
- Table de probabilités conditionnelles
- Le réseau doit être acyclique
Systèmes à base d'estimation (valuation-based system)
Source: Prakash P. Shenoy - Valuation-Based Systems (Slides)
Bases
Système mathématique formel pour représenter et raisonner avec des connaissances. Deux parties:
- Statique: Représentation des connaissances
- Variables: ensemble fini
\Phi = \lbrace X, Y, Z, \ldots \rbrace
et sous-ensemblesr,s,t,\ldots
- Estimations: ensemble fini
\Psi = \lbrace \rho, \sigma\, \tau \rbrace
qui encodent les connaîssance s sur un sous-ensemble de variable.
- Variables: ensemble fini
- Dynamique: Raisonnement avec les connaissances avec des opérateurs
- Combinaison:
\oplus: \Psi \times \Psi \rightarrow \Psi
- Margiinalisation:
-X: \Psi \rightarrow \Psi
permet de sortir X du domaine d'une estimation
- Combinaison:
Représentation graphique: réseau d'estimations
Abstraction de plusieurs calculs d'incertitude:
- Calcul propositionnel
- Théorie des probabilités
- Théorie des fonctions de croyances: application au problème du Capitaine dans les slides
- Calcul de croyances épistémique de Spohn
- Théorie des possiibilités
Problème du capitaine: Estimer le nombre de jours de retard de son bateau à destination. Plusieurs facteurs d'incertitude.
Combinaison: Règle de Dempster