免費試用
當前位置: 首頁 > 知識分享 > 智能語音平台質檢係統好用嗎?

智能語音平台質檢係統好用嗎?

原創

2023/02/14 15:50:05

來源:米兰体育官网入口

作者:Tian

圖標 2731

本文摘要

目前常見的智能聲學模型需要開發者進行專(zhuan) 業(ye) 訓練,後生成對應的音頻流產(chan) 品或音頻數據;對於(yu) 非聲學模型來說,需要對開發者提供的原始音頻進行專(zhuan) 業(ye) 處理,生成相應音效庫。而這些都無法直接應用於(yu) 智能語音平台之上;我們(men) 需要一個(ge) 質檢係統來幫助開發者們(men) 監督及反饋訓練質量。

語音識別、語音合成、聲紋識別技術,可以將一個(ge) 人的聲音轉化為(wei) 另一個(ge) 人的聲音,將其變成另一個(ge) 人。而智能語音平台作為(wei) 聲音處理的硬件平台,是智能語音技術落地應用的重要載體(ti) 。目前常見的智能聲學模型需要開發者進行專(zhuan) 業(ye) 訓練,後生成對應的音頻流產(chan) 品或音頻數據;對於(yu) 非聲學模型來說,需要對開發者提供的原始音頻進行專(zhuan) 業(ye) 處理,生成相應音效庫。而這些都無法直接應用於(yu) 智能語音平台之上;我們(men) 需要一個(ge) 質檢係統來幫助開發者們(men) 監督及反饋訓練質量。

智能語音平台質檢係統好用嗎

我們(men) 推薦使用第三方服務進行質檢。對於(yu) 第三方服務,我們(men) 提供了兩(liang) 種質檢方式;一種是直接從(cong) 錄音文件中提取質檢數據進行處理,一種是從(cong) 平台上傳(chuan) 語音文件到第三方服務進行識別分析。

1、數據采集

采集的音頻文件包括了從(cong) 設備端到服務端的所有音視頻數據。

包括:

A、本地設備錄製的音頻文件;

B、雲(yun) 服務器保存的音頻文件;

2、質檢分析

質檢分析結果可在質檢係統中直接查看,並支持導出數據。

通過對聲音進行識別後,係統會(hui) 根據用戶上傳(chuan) 的聲音文件,結合文本檢測技術,對錄音文件的內(nei) 容進行檢測;然後結合文本檢測技術與(yu) 文本識別技術形成音頻檢測報告。

該部分報告將詳細介紹音頻文件中各聲學部分的內(nei) 容及缺陷、語音部分的信息等內(nei) 容。

同時可對該音頻文件進行評分,並在後台統計得出對應評分結果及其占比,從(cong) 而提供相應的反饋及建議。

另外還可以提供針對某一特定領域產(chan) 品訓練時用到的特征詞、特征詞組、特定領域等關(guan) 鍵詞進行相關(guan) 統計分析和可視化輸出,方便開發者更好地理解模型訓練結果及提高訓練效果。

3、結果輸出

輸出結果包含三種:

標準輸出:可供開發者進行訓練時使用,例如測試數據或檢測結果等;

標準輸出:供產(chan) 品提供方進行分析時使用,例如根據聲音參數、聲壓級等進行相關(guan) 參數的優(you) 化等。

4、平台管理

管理服務:

包括對係統的維護,修改及刪除等;

包括對設備的監控和故障診斷的功能;

支持對係統中的所有功能進行監控。

管理方式:平台端管理方式,可使用“管理工具”或“軟件”等進行添加、刪除及修改服務列表;

5、其他功能

支持離線使用,可遠程調用離線語音識別功能;

若轉載請注明出處:https://www.lmsnkj.com/info/3651.html