新聞中心
News Center
11月26日消息,美國(guó)芯片制造商英偉達(dá)當(dāng)?shù)貢r(shí)間周一展示了一種能生成音樂和音頻的人工智能新模型。這種人工智能模型主要面向音樂、電影和視頻游戲的制作人,可以修改聲音并產(chǎn)生新奇音效。
英偉達(dá)目前是全球最大的人工智能系統(tǒng)芯片和軟件供應(yīng)商。公司表示,雖然這項(xiàng)名為“Fugatto”(Foundational Generative Audio Transformer Opus 1縮寫)的技術(shù)有發(fā)展?jié)摿?,但目前還沒有公開發(fā)布這項(xiàng)技術(shù)的計(jì)劃?!癋ugatto”與Runway等初創(chuàng)公司和Meta等大科技公司展示的技術(shù)類似,能夠根據(jù)文本提示內(nèi)容生成音頻或視頻。不過,英偉達(dá)的新模型有自己的獨(dú)到之處:其可以根據(jù)文本描述生成特定音效和音樂,比如讓小號(hào)發(fā)出像狗叫一樣的新奇聲音。“Fugatto”與其他人工智能技術(shù)的不同之處在于,能夠消化和修改現(xiàn)有音頻。例如,它可以將鋼琴演奏的一段旋律轉(zhuǎn)換成人聲演唱,或者改變錄制音頻中的口音以及表達(dá)出來的情緒。
英偉達(dá)的新模型是用開源數(shù)據(jù)訓(xùn)練的。公司表示,仍在討論是否以及如何公開發(fā)布這項(xiàng)技術(shù)。
生成式人工智能模型的開發(fā)者仍在探索如何防止用戶濫用技術(shù),比如該怎么杜絕用戶生成虛假信息或創(chuàng)造出受版權(quán)保護(hù)的角色、造成侵犯版權(quán)的行為等等。同樣,OpenAI和Meta也沒有宣布他們計(jì)劃什么時(shí)候向公眾發(fā)布能生成音頻或視頻的模型。