圖書中心

多媒體通信首頁>圖書中心>信息通信類

視聽媒體感知與識別
  • 書     名:視聽媒體感知與識別
  • 出版時間:2015-08-04
  • 編 著 者:明悅
  • 版       次:1-1
  • I  S  B N:978-7-5635-4415-8
  • 定       價:¥26.00元

內容簡介線

目錄介紹線

前言 iii
1 緒論 1
1.1 概述 1
1.2 人類視覺感知系統 2
1.2.1 人類視覺感知系統的生理結構 2
1.2.2 視覺感知 5
1.3 人類聽覺感知系統 6
1.3.1 語音聽覺器官的生理結構 6
1.3.2 聽覺感知 7
1.4 視聽感知系統框架和基本組成 8
1.5 本章小結 10
參考文獻 10
2 視覺感知與識別人臉識別 13
2.1 三維人臉識別問題 13
2.2 三維人臉圖像的預處理 14
2.2.1 三維人臉區域提取 14
2.2.2 三維人臉模型姿態匹配對齊 17
2.2.3 三維人臉主要器官區域分割 20
2.2.4 實驗及結果分析 22
2.3 三維人臉表面特征描述子 26
2.3.1 基于彎曲不變量的三維人臉表面描述子 27
2.3.2 基于邊界球描述子的三維人臉表征方法 28
2.3.3 基于三維尺度不變特征變換的表征方法 30
2.3.4 實驗及結果分析 32
2.4 基于區域稀疏回歸模型的三維人臉特征提取算法 37
2.4.1 問題的提出 37
2.4.2 基于RGSRM的特征提取 41
2.4.3 實驗及結果分析 42
2.5 本章小結 47
參考文獻 47
3 視覺感知與識別運動目標分析 55
3.1 運動目標分析問題 55
3.2 融合深度信息的運動目標檢測 56
3.2.1 行為視頻預處理 56
3.2.2 背景差分和幀間差分相結合的人體檢測方法 57
3.2.3 基于邊緣變化率的手部檢測 61
3.3 基于跟蹤學習檢測的運動人體跟蹤 65
3.3.1 跟蹤學習檢測算法原理 65
3.3.2 改進的融合深度信息的TLD 72
3.3.2 實驗及結果分析 73
3.4 融合深度信息的運動目標特征描述 75
3.4.1 三維移動尺度不變特征描述 75
3.4.2 快速移動尺度不變性特征 79
3.4.3 融合時空紋理特征的特征描述方法 86
3.4 本章小結 93
參考文獻 93
4 聽覺感知與識別語音識別及評測 103
4.1 聽覺感知數據的預處理 103
4.2 聽覺感知的特征表示 106
4.2.1 線性預測倒譜參數 106
4.2.2 美爾頻率倒譜系數 107
4.2.3 基頻提取 108
4.3 聽覺感知的模型學習 109
4.3.1 隱馬爾可夫模型 109
4.3.2 基于改進的BP人工神經網絡的聲調感知識別模型 112
4.4 實時語音識別和發音評測 114
4.4.1 基于韻律建模的漢語語音識別 115
4.4.2 漢語發音檢測 116
4.4.3 基于聲學和韻律參數的漢語發音評測 117
4.4 本章小結 120
參考文獻 120
5 視聽感知識別技術的應用實例 127
5.1 基于語音識別與評測的遠程交互學習系統 127
5.1.1 系統概述 127
5.1.2 虛擬三維游戲設計 130
5.2 人體行為分析系統平臺的設計與實現 134
5.2.1 人體行為分析系統平臺的實現 135
5.2.2 人體行為識別系統的個性化控制應用場景 137
5.2.3 行為分析系統GPU處理的實現 140
5.3 基于視覺感知的盲區路況提示系統 142
5.3.1 系統總體架構 142
5.3.2 系統各模塊功能設計 143
5.3.3 系統設計規劃 145
5.3.4 功能實現成果展示 148
5.4 基于聽覺感知的哼唱音樂檢索系統 154
5.4 本章小結 158
參考文獻 161
亚洲欧美日韩精品久久