人工智能:現代方法(第 4 版)#
第二章:智能代理#
什麼是智能代理?#
- 智能代理是指能夠自主地執行任務的程式或機器人。
智能代理的組成部分#
- 感知:智能代理通過傳感器感知環境的狀態。
- 視覺傳感器:如攝影機。
- 聲音傳感器:如麥克風。
- 觸覺傳感器:如觸摸屏、力傳感器。
- 地理定位傳感器:如 GPS。
- 推理:智能代理根據感知到的信息進行推理、判斷。
- 邏輯推理:通過邏輯規則推出結論。
- 概率推理:通過概率統計方法進行推理。
- 機器學習:通過學習得到知識,從而進行推理。
- 行動:智能代理通過執行操作來改變環境。
- 執行器:如電機、執行器臂等。
- 通訊設備:如 Wi-Fi、藍牙等。
智能代理的分類#
- 簡單反射性代理:僅根據當前的感知直接執行動作。
- 帶模型的代理:在對環境的觀察中建立一個內部模型從而更好地執行操作。
- 模型:對環境的一種抽象描述。
- 用途:預測環境變化、規劃行動。
- 環境模型:地圖、場景等。
- 操作模型:如何執行任務。
- 帶學習能力的代理:通過學習改善性能,包括基於模型的學習和無模型學習。
- 基於模型的學習:使用環境模型進行學習。
- 監督學習:通過標註數據進行學習。
- 強化學習:通過獎懲進行學習。
- 無模型學習:不使用環境模型,直接從互動中學習。
- 非監督學習:通過發現數據中的模式進行學習。
- 深度學習:通過模擬神經網絡進行學習。
- 基於模型的學習:使用環境模型進行學習。
- 自主代理:能夠自我設定目標和計劃,並進行自我評估和調整。
- 目標:自主的、長期的目標。
- 長期目標:達到特定狀態或完成特定任務。
- 短期目標:為了實現長期目標而制定的具體計劃。
- 計劃:為了實現目標所採取的序列行動。
- 計劃制定:制定可行的計劃。
- 計劃執行:執行計劃並不斷調整。
- 目標:自主的、長期的目標。