Computational Psychiatry

TD Learning model simulation

Through temporal difference (TD) learning, an agent learns from future rewards and backpropagates prediction errors by updating value estimates (continually updating beliefs about future rewards as it approaches the future). It is a core concept of model-free reinforcement learning.

笔记|强化学习,多巴胺,神经影像

在喂食之前响铃,久而久之,狗会将铃声和食物联系起来,听到铃声时立即分泌唾液。通过食物(强化物 reinforcer),铃声和唾液分泌之间形成联系(association/contingent),且逐渐强化(reinforce),形成条件反射。

笔记|脑的计算隐喻

大脑是个信息处理系统(Information Processing System),这里只是哲学上的比喻并非物理上的。历史上也有人把大脑比喻成液压器、蒸汽机,都是受到当时最新技术的影响。比喻只是为了帮助人类更形象地理解大脑。也有研究发现信息处理之外大脑还有自上而下的意义提取功能(Walter Freeman对兔子嗅觉细胞的研究),之后再展开写。