喜びは報酬

お間抜けだ。報酬系をすっかり忘れていた。評価軸に基づいて達成意欲とすべき方向性を報酬として示せば、行動目的と達成とその系が先の感情に含まれれば、発達の方向性は示せる。人工知能の戦略的設定が人間でいうところの信条のようなものだ。ホームランを打って喜ぶのか、他人の財布から金銭を盗んで喜ぶのか、その人間の考え方次第のようなことで学習の強化の方向性を設定できるように仕組んでおくことが効率よく期待する通りの反応を発揮すると思う。なんていうか、ミクロの技術に懸命で、マクロのセンスを欠いているような感触はデジャヴのようなものだ。人間とは、という問いとか自己認識のような哲学的な問いかけに対する人工知能の取り組みにも原始的だからこそ打開の一方策になると思う。