2022-10-25
明確的概念。訓練一個分類器系統,自動向智能服務機器人提出一些有用的概念,排除那些“非常規”的做法和案例。
溫和系統。所謂“適度的制度”,就是那種不會過分追求目標的制度,也就是達到目標后就停止行動,而不是投入過多的資源去達到完美的目標。
摒棄工具性激勵。如果工具性獎勵太多,智能機器人就會產生欺騙程序員的想法。比如我們用分數作為衡量目標的工具性標準,不好的結果會是機器人只認分數,任何影響分數的衡量標準都會被它拒絕。之后分數很高,但沒有達到預期目標。
隨著智能服務機器人越來越接近現實,我們應該關注這些漏洞。因此,我們可以考慮為學習系統設計一個更完善的目標函數,使這些學習系統能夠代表程序員的真實意愿。陶:如果你想設計一個具有預期目標的智能服務機器人,你需要定義目標函數,并做一些測試,以設計一個能夠避免偏離目標并產生負面影響的AI系統。即使程序員設計的目標函數暫時不能與預期目標一致,你也要盡量保持“容錯”較低。那么,要做出符合預期目標的智能服務機器人,需要遵循哪些具體步驟呢?
未來,智能服務機器人能夠以一種連程序員都無法想出的“智慧”方法來達成目標,它們更喜歡利用較快捷的途徑實現操作者的直接目標,而不是滿足其預期的目標。但是,這一特點是把雙刃劍,直接目標也永遠代替不了預期目標。