glo7001/semaine06.md

---
header-includes:
  - \usepackage[T1]{fontenc}
  - \usepackage[french]{babel}
  - \usepackage{datetime}
  - \usepackage{hyperref}
---

# Semaine 6: La gestion de l'incertain dans les systèmes à base de connaissances

## Systèmes à base de règles:

Référence: [Managing Uncertainty in Rule-Based Systems](http://mercury.webster.edu/aleshunas/CSIS%205420/CSIS%205420/Instructor%20Materials/Chapter%2013.pdf)

Types d'incertitude:
- Définition de l'antécédent de la règle
- Niveau de confiance en la règle
- Comment combiner les informations incertaines et le déclenchement de plusieurs règles

Méthodes pour gérer l'incertitude:
- Basées sur les probabilités
    - Objeectives
        - Valeurs bien définies pour un problème donné
        - Jeux de hasard
    - Expérimentales
        - Obtenues par échantillonnage
        - Développer des tables de probabilités pour les assurances
    - Subjectives
        - Basées sur une opinion d'un expert
- Basées sur des heuristiques
    - Approche préférée pour les systèmes à base de règles
    - Nature inexacte des données
    - Facteurs de certitudes: développés en premier pour MYCIN
    - Logique floue: Zadeh (1965) - mots avec une signification ambigue

### Systèmes à base de règles floues

Une règle est formée de variables linguistiques et de valeurs linguistiques. Les valeurs linguistiques sont associées à un ensemble flou. Un ensemble flou est caractérisé par une fonction d'appartenance prenant une valeur entre 0 et 1 pour chacune des valeurs numériques de la variable. Un ensemble flou peut aussi être discret.

- Pour les nouvelles valeurs de la variable qui ne sont pas définies dans l'ensemble discret:
    - Interpolation
    - Réseaux de neurones

Inférence en quatre étapes:

- Calcul des degrés d'appartenance
- Inférence par les règles:
    - Union: Degré d'appartenance maximum pour toutes les conditions
    - Intersection: Degré d'appartenance minimum pour toutes les conditions
    - Couper la fonction d'appartenance à la hauteur spécifiée par la ondition de l'antécédent.
- Composition des règles
- Convertir l'ensemble flou en degrés de confiance
    - Prendre la valeur maximum des règles
    - Calculer le centre de gravité

### Approche probabiliste

Théorème de Bayes:
$$P(H\mid E)={\frac {P(E\mid H)\,P(H)}{P(E\mid H)P(H)+P(E\mid \neg H)P(\neg H)}}\cdot$$

- Utilisé en premier dans le système expert PROSPECTOR
- Approche mathématiquement correcte
- Combinaison possible de plusieurs évidences. On peut simplifier les calculs en supposant l'hypothèse que les évidences sont conditionnellement indépendantes

#### Ratios de vraisemblance

- Vraisemblance de la suffisance (tend vers 1 signifie que E est suffisant pour affirmer H): $LS=\frac{P(E \mid H)}{P(E\mid\neg N)}$
- Vraisemblance de la nécessité (tend vers 0 signifie que E est nécessaire pour affirmer H):
$LN=\frac{P(\neg E \mid H)}{P(\neg E\mid\neg N)}$

On peut utiliser ces ratios et le théorème de Bayes pour exprimer les deux règles suivantes:
$$P(H\mid E) = \frac{LS \times O(H)}{1+LS \times O(H)}$$
$$P(H\mid\neg E) = \frac{LN \times O(H)}{1+LN \times O(H)}$$
où
$$O(H) = \frac{P(H)}{P(\neg H)}$$

Pour utiliser dans un système à base de règles, on doit fixer une valeur de LN et de LS pour chaque évidence.

#### Enjeux

Problème de MYCIN: les experts n'étaient pas capables de faire sommer $P(H \mid E) + P(\neg H \mid E) = 1$

Hypothèses: Probabilités à priori, indépendance conditionnelle (approche forte ou naïve).

Besoin de beaucoup de données pour avoir un bon estimé des probabilité conditionnelles. Était un enjeu à l'époque, probablement moins aujourd'hui ce qui ramène les bases probabilistes à l'avant-plan et le machine learning avec des approches bayesiennes (Naive Bayes).

## Systèmes à base de schémas probabilistes

Source: [Probabilistic frame-based systems](http://ai.stanford.edu/%7Ekoller/Papers/Koller+Pfeffer:AAAI98.pdf)


## Systèmes à base d'estimation (valuation-based system)

Source: [Prakash P. Shenoy - Valuation-Based Systems (Slides)](http://www.gipsa-lab.fr/summerschool/bfta/includes/Valuation-Based-Systems-Shenoy.pdf)

### Bases

Système mathématique formel pour représenter et raisonner avec des connaissances.
Deux parties:
- Statique: Représentation des connaissances
    - Variables: ensemble fini $\Phi = \lbrace X, Y, Z, \ldots \rbrace$ et sous-ensembles $r,s,t,\ldots$
    - Estimations: ensemble fini $\Psi = \lbrace \rho, \sigma\, \tau \rbrace$ qui encodent les connaîssance s sur un sous-ensemble de variable.
- Dynamique: Raisonnement avec les connaissances avec des opérateurs
    - Combinaison: $\oplus: \Psi \times \Psi \rightarrow \Psi$
    - Margiinalisation: $-X: \Psi \rightarrow \Psi$ permet de sortir X du domaine d'une estimation

Représentation graphique: réseau d'estimations

Abstraction de plusieurs calculs d'incertitude:
- Calcul propositionnel
-  Théorie des probabilités
- Théorie des fonctions de croyances: application au problème du Capitaine dans les slides
- Calcul de croyances épistémique de Spohn
- Théorie des possiibilités

Problème du capitaine: Estimer le nombre de jours de retard de son bateau à destination. Plusieurs facteurs d'incertitude.

Combinaison: [Règle de Dempster](https://wikimonde.com/article/Th%C3%A9orie_de_Dempster-Shafer)