人工智能：現代方法（第4版）閱讀分析第二章

人工智能：現代方法（第 4 版）#

感知：智能代理通過傳感器感知環境的狀態。
- 視覺傳感器：如攝影機。
- 聲音傳感器：如麥克風。
- 觸覺傳感器：如觸摸屏、力傳感器。
- 地理定位傳感器：如 GPS。
推理：智能代理根據感知到的信息進行推理、判斷。
- 邏輯推理：通過邏輯規則推出結論。
- 概率推理：通過概率統計方法進行推理。
- 機器學習：通過學習得到知識，從而進行推理。
行動：智能代理通過執行操作來改變環境。
- 執行器：如電機、執行器臂等。
- 通訊設備：如 Wi-Fi、藍牙等。

簡單反射性代理：僅根據當前的感知直接執行動作。
帶模型的代理：在對環境的觀察中建立一個內部模型從而更好地執行操作。
- 模型：對環境的一種抽象描述。
- 用途：預測環境變化、規劃行動。
  - 環境模型：地圖、場景等。
  - 操作模型：如何執行任務。
帶學習能力的代理：通過學習改善性能，包括基於模型的學習和無模型學習。
- 基於模型的學習：使用環境模型進行學習。
  - 監督學習：通過標註數據進行學習。
  - 強化學習：通過獎懲進行學習。
- 無模型學習：不使用環境模型，直接從互動中學習。
  - 非監督學習：通過發現數據中的模式進行學習。
  - 深度學習：通過模擬神經網絡進行學習。
自主代理：能夠自我設定目標和計劃，並進行自我評估和調整。
- 目標：自主的、長期的目標。
  - 長期目標：達到特定狀態或完成特定任務。
  - 短期目標：為了實現長期目標而制定的具體計劃。
- 計劃：為了實現目標所採取的序列行動。
  - 計劃制定：制定可行的計劃。
  - 計劃執行：執行計劃並不斷調整。