服務簡介

以常見的Restful API介面提供開發人員使用這些預載好的API,本服務內含『影像辨識』、『語音合成』及『語音辨識』三大類型,使開發人員的應用程式具有影像/語音分析與自然發音能力,卻無需被複雜的AI演算法所限制,且功能服務將與日俱增。

服務整體運作架構

詳見各功能。

功能目錄

序號 功能 簡述
1 人臉辨識
人臉驗證:上傳檢索人臉及侯選人臉照片,取得彼此間的相似分數
2 人形偵測
上傳檢索圖片中是否有人形,如有將回傳其圖片中人形邊框位置。
3 人臉性別/年齡辨識
上傳人形圖片後,將回傳人形性別以及年齡的偵測結果。

(1)單人

(2)多人

4 無人機群眾密度計數
資料圖片輸入,將回傳人數估計結果,及人群密度圖。
5 電子圍籬
上傳一段影片後,將進行電子圍籬偵測
6 2D人流計數
上傳一段影片後,將進行人流計數
7 車牌辨識
辨識圖片中車牌上下左右邊界及車牌號碼
8 車輛偵測
偵測圖片中車輛的位置以及種類。
9 汽車廠牌辨識
辨識圖片中汽車的位置以及廠牌。
10 語音合成

(1)中英文合成:帶入輸入中英文文字參數後,進行語音合成

(2)台語合成:帶入輸入台語文字參數後,進行語音合成

11 語音辨識

(1)connect:要求進行語音辨識,獲得AsrReferenceId。

(2)syncData:傳送音訊資料,進行語音辨識。

(3)stopRcg:停止語音辨識。