OpenAI 和微軟實施 Vall-E:擴展人工智能力量的新型語音聊天機器人

  |   2023年2月14日

OpenAI 和微軟通過實施新的語音聊天機器人Vall-E ,繼續在人工智能領域與谷歌展開較量。這是一款語音合成軟件,只要聽三秒就可以模擬出人聲。

換句話說,這是微軟和 OpenAI 開發的生成式人工智能系統的最新部分,自 2019 年以來,比爾蓋茨的巨頭通過多年、數十億美元的合作關係與它聯繫在一起。

Valle-E是AGI, Artificial General Intelligence的工具,即可以模擬人類智能的“通用”或“強”人工智能。因此,與我們目前所知道的“窄”或“弱”人工智能相反。

後者能夠對特定任務做出預設動作,但不能對計劃外動作做出反應。近年來,AI 聊天機器人的表現不如其創造者預期,因爲它們僅限於執行小任務且錯誤率高。

開發 Valle-E 是爲了與高質量語音合成工具一起使用,並從示例樣本創建原始音頻。 OpenAI 將 Valle-E 定義爲“自然編解碼器語言模型”,因爲它的操作基於一種稱爲EnCodec的技術。

這家由Elon Musk和 Sam Altman等人資助的初創公司還擁有 ChatGPT 的創建,這是一種聊天機器人,可以通過記住和學習以前的行爲和先例來維持與用戶的互動對話。

因此,正如ChatGPT能夠自主生成代碼一樣,Valle-E 也旨在通過收聽音頻樣本來創建離散音頻編解碼器。

完全像人一樣行事。

與用於文本的GPT-3軟件和用於圖像的Dall-E/Stable Diffusion一起,Valle-E 音頻系統完成了 ChatGPT 三聯,旨在徹底改變生成 AI領域。

OpenAI 和微軟推出的新工具的精妙之處在於 Valle-E 能夠識別說話人的音色、音調和情緒基調,並在聽完三秒鐘後重播。

音頻編輯中的應用程序很多,對軟件可能被操縱和濫用的批評也很多。毫不奇怪,與 ChatGPT 不同,微軟沒有提供 Vall-E 的代碼供其他人試驗。

該軟件已經合成的語音樣本也可以在 Valle-E 網站上找到。特別是,可以聽到多種採樣變體,包括: Speaker Prompt、Ground Truth、Baseline 和 Vall-E。

第一個選項是一個音頻片段,其語音內涵必須由 AI 再現;在第二個中,人工智能必須提出一個比較的句子。另一方面,第三個是使用當前可用的語音合成技術生成的示例。最後,Vall-E 是微軟軟件生成的原始語音。

微軟和 OpenAI 研究人員似乎意識到了這項技術的潛在危害。事實上,他們在一份公開文件中傳達了以下信息:

“由於 Vall-E 可以合成保持說話者身份的語音,這種技術可能會帶來與模型使用不當相關的潛在風險,例如欺騙語音識別或冒充某人。”

因此,微軟補充說,爲了減輕這種風險,可以建立一個檢測模型來區分音頻片段是否由 Vall-E 合成。對此,兩大巨頭在進一步的模型開發中也將貫徹微軟的人工智能原則。

然而,效仿的風險並不是產生懷疑和恐懼的唯一因素。 Vall-E 使用Meta製作的 LibriLight 音頻庫進行訓練,其中包含60,000小時的英語演講,主要從公共領域的有聲讀物中提取,由志願者錄製和閱讀。

無論如何,要提高綜合能力,Vall-E 需要將學習池擴展到整個互聯網。下一步使 ChatGPT 的前身 GPT-3 能夠實現令人印象深刻的句子處理、編寫和組裝功能。

儘管如此,該軟件還容易制定暴力、性別歧視和種族歧視的內容,正是因爲它處理了從整個網絡上不分青紅皁白地獲取的示例。新的 Vall-E 也可能發生這種情況。

在這種情況下,過濾操作將需要使用大量人力,鑑於影響大型科技公司的裁員浪潮,目前大型數字巨頭似乎沒有預見到這一點。

正如預期的那樣,與微軟和 OpenAI 競爭的是谷歌,它將推出Bard ,這是來自DeepMind 的聊天機器人,該公司已被谷歌的Alphabet收購。 Bard 看起來就像是 ChatGPT 的精確副本,但沒有更新缺陷。

谷歌 CEO 桑達爾·皮查伊 (Sundar Pichai)介紹了這款新軟件,它是一種從網絡上獲取信息以提供新鮮、高質量回復的工具。他所說的“新鮮”是指不斷更新,這是微軟的 AI 仍然無法做到的。

簡而言之,Bard 的目標是爲簡單的問題生成詳細的答案。它的操作基於LaMDA ,即對話應用程序的語言模型,谷歌自己的一位工程師之前曾將其描述爲“有感知力”。

不可否認,谷歌宣佈推出巴德是科技愛好者們期待的。畢竟,根據《華爾街日報》的報道,谷歌母公司 Alphabet 在 2021 年在人工智能方面的投資超過310 億美元,超過任何其他競爭對手。

在 ChatGPT 取得成功後,該公司因此決定召集最優秀的人才:創始人拉里佩奇和謝爾蓋布林。無論如何,毫無疑問,人工智能軟件是創新領域的寶貴資源。

的確,即使是亞馬遜、Meta 和蘋果,也肯定不會坐視別人在做什麼而不採取行動。然而,雖然競爭在研究方面是一個很好的加速器,但也存在這樣的風險,即在最佳人工智能的競賽中,存在錯誤、侷限性和風險的有缺陷的系統將被使用,而不會過多關注全局。

推薦閱讀

相關文章

黃金價格可能會繼續上漲

三個月來,金價一直在上漲。事實上,它在 2022 年 11 月初觸及年度低點 1,640 美元/盎司,這是它在 9 月份觸及的價格。然而,10 月的反彈使其回到 1,720 美元左右,而 11 月 4 日開始的反彈在 2 月初將其推高至近 2,000 美元。

Coinbase:2022 年第三季度收益

Coinbase (COIN)股票在公佈季度業績後在市場上遭受重創,該季度業績報告淨虧損 5.45 億美元。

亞馬遜凍結招聘

據《紐約時報》報道,亞馬遜正在採取掩護措施並實施本年度的招聘凍結,在通脹、地緣政治局勢以及能源和大宗商品價格上漲的情況下,強勢美元將成爲斷頭臺。

假新聞:Vitalik Buterin 黑客攻擊事工

近日,以部長 Roberto Cingolani爲首的意大利生態轉型部 Twitter 賬號成爲黑客攻擊的目標,並傳出攻擊者可能是以太坊區塊鏈創始人Vitalik的消息。布特林。

要求SEC主席辭職的請願書

16,000 人在 Change.org 上籤署請願書,要求SEC 主席 Gary Gensler 辭職社區希望SEC主席辭職據報道,公民Roy Ferneini幾天前在專門網站 Change.org 上發起的請願書已經收集了 16,000 多個簽名。

Revolut 對意大利通貨膨脹的研究

Revolut 在意大利進行了一項研究,旨在研究通貨膨脹對消費者購買習慣的影響。意大利:民眾捲起袖子對抗通脹由於通貨膨脹率目前為 8%,意大利人口正面臨購買力的顯著喪失。根據Istat的數據,僅上個月全國消費者價格指數就上漲了1.2% 。