| Hot: |
Nu fac asta de obicei , dar SINCER mi se pare genial absolut tot legat de acest video asa ca incerc sa nu uit de unde sa il iau (?)
Bofh rants
16
Sep
| Hot: |
Nu fac asta de obicei , dar SINCER mi se pare genial absolut tot legat de acest video asa ca incerc sa nu uit de unde sa il iau (?)
14
Sep
| Hot: |
Vom usura procesul de calcul al unei decizii . Fara sa mai scriu tona de aberatii prin care putem deduce asta ( cu toate ca e mai mult decat logic ) vom avea afirmatia ca orice decizie poate fi rezumata la 0 sau 1 asa ca :
A) Pentru finalul deciziei
- se va calcula factorul aleator
- se va calcula daca recompensa (0 ) > recompensa ( 1)
- se va calcula daca SUMA ( I(0) fata de factorul(n) ) > SUMA ( I(1) fata de factorul(n) ) ; I = influenta ; n = oricare din factori
suma se calculeaza prin apelarea recursiva a functiei pana cand n = 0 si ca urmare nu se mai vede nici o influenta . ( poate ar trebui limitat )
Se decide intre actiunea 0 / 1
B) Calculul recompenselor :
B.1.) in caz ca nu sunt definite in functiile de decizie ( nu in sandbox ,evident , dar mai mult ca sigur in situatiile reale ) recompensele se vor calcula folosind functia decizionala recursiv pana la descoperirea unei experiente anterioare ( folosindu-se de n-ul mentionat mai devreme ) .
B.2.) Daca nu se gaseste nici o legatura , se va folosi random-ul artificial pentru a se decide recompensa pentru ultimele ramuri ale influentelor (n) . Se va aplica formula pana cand toate ramurile se vor completa cu rezultate (recompense ) temporare .
B.3.) La urmatoarea iteratie in care este specificata o recompensa ( si prin care se ajunge la influenta n ) se vor asigna noile valori.
Ca urmare se va elimina posibilitatea existentei unei optiuni incorecte.
C)
C.1.) Recompensele si influentele vor mai avea o serie de indici temporali. Odata cu trecerea unei perioade definite de timp (poate ca se complica prea mult ? ) valoarea recompensei/influentei va fi diminuata.
C.2.) Orice noua iteratie a functiei I(n) -> R ( influenta factorului n are rezultatul R ) in care R va fi definit va suprascrie valoarea veche ( poate ar trebui sa pun niste limitari ) .
C.3.)Daca timpul necesar degradarii influentei/recompensei a trecut se va aplica metoda de la punctul B.1./B.2.
EOR
Tags: A.I.
| M | T | W | T | F | S | S |
|---|---|---|---|---|---|---|
| « Sep | ||||||
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 | |||