OpenAI 和微軟實施 Vall-E：擴展人工智能力量的新型語音聊天機器人

OpenAI 和微軟通過實施新的語音聊天機器人Vall-E ，繼續在人工智能領域與谷歌展開較量。這是一款語音合成軟件，只要聽三秒就可以模擬出人聲。

換句話說，這是微軟和 OpenAI 開發的生成式人工智能系統的最新部分，自 2019 年以來，比爾蓋茨的巨頭通過多年、數十億美元的合作關係與它聯繫在一起。

Valle-E是AGI， Artificial General Intelligence的工具，即可以模擬人類智能的“通用”或“強”人工智能。因此，與我們目前所知道的“窄”或“弱”人工智能相反。

後者能夠對特定任務做出預設動作，但不能對計劃外動作做出反應。近年來，AI 聊天機器人的表現不如其創造者預期，因爲它們僅限於執行小任務且錯誤率高。

開發 Valle-E 是爲了與高質量語音合成工具一起使用，並從示例樣本創建原始音頻。 OpenAI 將 Valle-E 定義爲“自然編解碼器語言模型”，因爲它的操作基於一種稱爲EnCodec的技術。

這家由Elon Musk和 Sam Altman等人資助的初創公司還擁有 ChatGPT 的創建，這是一種聊天機器人，可以通過記住和學習以前的行爲和先例來維持與用戶的互動對話。

因此，正如ChatGPT能夠自主生成代碼一樣，Valle-E 也旨在通過收聽音頻樣本來創建離散音頻編解碼器。

完全像人一樣行事。

與用於文本的GPT-3軟件和用於圖像的Dall-E/Stable Diffusion一起，Valle-E 音頻系統完成了 ChatGPT 三聯，旨在徹底改變生成 AI領域。

OpenAI 和微軟推出的新工具的精妙之處在於 Valle-E 能夠識別說話人的音色、音調和情緒基調，並在聽完三秒鐘後重播。

音頻編輯中的應用程序很多，對軟件可能被操縱和濫用的批評也很多。毫不奇怪，與 ChatGPT 不同，微軟沒有提供 Vall-E 的代碼供其他人試驗。

該軟件已經合成的語音樣本也可以在 Valle-E 網站上找到。特別是，可以聽到多種採樣變體，包括： Speaker Prompt、Ground Truth、Baseline 和 Vall-E。

第一個選項是一個音頻片段，其語音內涵必須由 AI 再現；在第二個中，人工智能必須提出一個比較的句子。另一方面，第三個是使用當前可用的語音合成技術生成的示例。最後，Vall-E 是微軟軟件生成的原始語音。

微軟和 OpenAI 研究人員似乎意識到了這項技術的潛在危害。事實上，他們在一份公開文件中傳達了以下信息：

“由於 Vall-E 可以合成保持說話者身份的語音，這種技術可能會帶來與模型使用不當相關的潛在風險，例如欺騙語音識別或冒充某人。”

因此，微軟補充說，爲了減輕這種風險，可以建立一個檢測模型來區分音頻片段是否由 Vall-E 合成。對此，兩大巨頭在進一步的模型開發中也將貫徹微軟的人工智能原則。

然而，效仿的風險並不是產生懷疑和恐懼的唯一因素。 Vall-E 使用Meta製作的 LibriLight 音頻庫進行訓練，其中包含60,000小時的英語演講，主要從公共領域的有聲讀物中提取，由志願者錄製和閱讀。

無論如何，要提高綜合能力，Vall-E 需要將學習池擴展到整個互聯網。下一步使 ChatGPT 的前身 GPT-3 能夠實現令人印象深刻的句子處理、編寫和組裝功能。

儘管如此，該軟件還容易制定暴力、性別歧視和種族歧視的內容，正是因爲它處理了從整個網絡上不分青紅皁白地獲取的示例。新的 Vall-E 也可能發生這種情況。

在這種情況下，過濾操作將需要使用大量人力，鑑於影響大型科技公司的裁員浪潮，目前大型數字巨頭似乎沒有預見到這一點。

正如預期的那樣，與微軟和 OpenAI 競爭的是谷歌，它將推出Bard ，這是來自DeepMind 的聊天機器人，該公司已被谷歌的Alphabet收購。 Bard 看起來就像是 ChatGPT 的精確副本，但沒有更新缺陷。

谷歌 CEO 桑達爾·皮查伊 (Sundar Pichai)介紹了這款新軟件，它是一種從網絡上獲取信息以提供新鮮、高質量回復的工具。他所說的“新鮮”是指不斷更新，這是微軟的 AI 仍然無法做到的。

簡而言之，Bard 的目標是爲簡單的問題生成詳細的答案。它的操作基於LaMDA ，即對話應用程序的語言模型，谷歌自己的一位工程師之前曾將其描述爲“有感知力”。

不可否認，谷歌宣佈推出巴德是科技愛好者們期待的。畢竟，根據《華爾街日報》的報道，谷歌母公司 Alphabet 在 2021 年在人工智能方面的投資超過310 億美元，超過任何其他競爭對手。

在 ChatGPT 取得成功後，該公司因此決定召集最優秀的人才：創始人拉里佩奇和謝爾蓋布林。無論如何，毫無疑問，人工智能軟件是創新領域的寶貴資源。

的確，即使是亞馬遜、Meta 和蘋果，也肯定不會坐視別人在做什麼而不採取行動。然而，雖然競爭在研究方面是一個很好的加速器，但也存在這樣的風險，即在最佳人工智能的競賽中，存在錯誤、侷限性和風險的有缺陷的系統將被使用，而不會過多關注全局。

推薦閱讀