ajout q learning approximatif

2019-04-13 09:33:43 -04:00 · 2019-04-13 09:33:43 -04:00 · bfb304bd97
commit bfb304bd97
parent 77caa10f89
1 changed files with 13 additions and 2 deletions
--- a/reinforcement/qlearningAgents.py
+++ b/reinforcement/qlearningAgents.py
@ -208,14 +208,25 @@ class ApproximateQAgent(PacmanQAgent):
          where * is the dotProduct operator
        """
        "*** YOUR CODE HERE ***"
-        util.raiseNotDefined()
+        features = self.featExtractor.getFeatures(state, action)
+        weights = self.getWeights()
+        q_value = 0
+        for i in features.keys():
+            q_value += features[i]*weights[i]
+        return q_value
+        # util.raiseNotDefined()

    def update(self, state, action, nextState, reward):
        """
           Should update your weights based on transition
        """
        "*** YOUR CODE HERE ***"
-        util.raiseNotDefined()
+        features = self.featExtractor.getFeatures(state, action)
+        weights = self.getWeights()
+        difference = (reward + (self.discount * self.getValue(nextState))) - self.getQValue(state,action)
+        for i in features.keys():
+            self.weights[i] = weights[i] + self.alpha * difference * features[i]
+        # util.raiseNotDefined()

    def final(self, state):
        "Called at the end of each game."