亞馬遜推出全新 Nova Sonic 語音到語音模型
亞馬遜推出全新 Nova Sonic 語音到語音模型
【 香 港 】— AWS 亞馬遜宣布推出一款全新的基礎模型 Amazon Nova Sonic,將語音理解與語音生成統一於單一的模型中,使 AI 應用程式中的語音對話更貼近真人交流,可深入理解人類對話,捕捉語氣,語調同節奏。該模型透過 Amazon Bedrock 上的新 API 提供,可簡化語音應用開發流程,例如客戶服務通話自動化,以及涵蓋旅遊、教育、醫療、娛樂等領域的跨行業 AI agents。 在過去十餘年間,亞馬遜一直引領著語音技術的發展,致力於為對話式 AI 應用賦能 — 從打造全球領先的個人 AI 助手 Alexa,到開發 Amazon Web Services 的各類服務,如 Lex、Polly 和 Connect 等。然而,若要讓語音 AI 為客戶創造更多實際價值,它必須能夠理解人類對話的微妙與複雜性。在對話中,文字本身承載意義,但若沒有聲音語境賦予其深度,僅憑文字往往難以傳達完整資訊。如何表達與表達甚麼同樣重要,甚至更為關鍵。從過去直到現在,透過 AI 實現這一點仍是巨大挑戰。
一套捕捉語氣 風格與節奏的語音系統
閱讀全文...
|
|
|
|
|
|
JPAGE_CURRENT_OF_TOTAL |