OpenAI 和微軟通過實施新的語音聊天機器人Vall-E ,繼續在人工智能領域與谷歌展開較量。這是一款語音合成軟件,只要聽三秒就可以模擬出人聲。
換句話說,這是微軟和 OpenAI 開發的生成式人工智能系統的最新部分,自 2019 年以來,比爾蓋茨的巨頭通過多年、數十億美元的合作關係與它聯繫在一起。
Valle-E是AGI, Artificial General Intelligence的工具,即可以模擬人類智能的“通用”或“強”人工智能。因此,與我們目前所知道的“窄”或“弱”人工智能相反。
後者能夠對特定任務做出預設動作,但不能對計劃外動作做出反應。近年來,AI 聊天機器人的表現不如其創造者預期,因爲它們僅限於執行小任務且錯誤率高。
開發 Valle-E 是爲了與高質量語音合成工具一起使用,並從示例樣本創建原始音頻。 OpenAI 將 Valle-E 定義爲“自然編解碼器語言模型”,因爲它的操作基於一種稱爲EnCodec的技術。
這家由Elon Musk和 Sam Altman等人資助的初創公司還擁有 ChatGPT 的創建,這是一種聊天機器人,可以通過記住和學習以前的行爲和先例來維持與用戶的互動對話。
因此,正如ChatGPT能夠自主生成代碼一樣,Valle-E 也旨在通過收聽音頻樣本來創建離散音頻編解碼器。
完全像人一樣行事。
與用於文本的GPT-3軟件和用於圖像的Dall-E/Stable Diffusion一起,Valle-E 音頻系統完成了 ChatGPT 三聯,旨在徹底改變生成 AI領域。
OpenAI 和微軟推出的新工具的精妙之處在於 Valle-E 能夠識別說話人的音色、音調和情緒基調,並在聽完三秒鐘後重播。
音頻編輯中的應用程序很多,對軟件可能被操縱和濫用的批評也很多。毫不奇怪,與 ChatGPT 不同,微軟沒有提供 Vall-E 的代碼供其他人試驗。
該軟件已經合成的語音樣本也可以在 Valle-E 網站上找到。特別是,可以聽到多種採樣變體,包括: Speaker Prompt、Ground Truth、Baseline 和 Vall-E。
第一個選項是一個音頻片段,其語音內涵必須由 AI 再現;在第二個中,人工智能必須提出一個比較的句子。另一方面,第三個是使用當前可用的語音合成技術生成的示例。最後,Vall-E 是微軟軟件生成的原始語音。
微軟和 OpenAI 研究人員似乎意識到了這項技術的潛在危害。事實上,他們在一份公開文件中傳達了以下信息:
“由於 Vall-E 可以合成保持說話者身份的語音,這種技術可能會帶來與模型使用不當相關的潛在風險,例如欺騙語音識別或冒充某人。”
因此,微軟補充說,爲了減輕這種風險,可以建立一個檢測模型來區分音頻片段是否由 Vall-E 合成。對此,兩大巨頭在進一步的模型開發中也將貫徹微軟的人工智能原則。
然而,效仿的風險並不是產生懷疑和恐懼的唯一因素。 Vall-E 使用Meta製作的 LibriLight 音頻庫進行訓練,其中包含60,000小時的英語演講,主要從公共領域的有聲讀物中提取,由志願者錄製和閱讀。
無論如何,要提高綜合能力,Vall-E 需要將學習池擴展到整個互聯網。下一步使 ChatGPT 的前身 GPT-3 能夠實現令人印象深刻的句子處理、編寫和組裝功能。
儘管如此,該軟件還容易制定暴力、性別歧視和種族歧視的內容,正是因爲它處理了從整個網絡上不分青紅皁白地獲取的示例。新的 Vall-E 也可能發生這種情況。
在這種情況下,過濾操作將需要使用大量人力,鑑於影響大型科技公司的裁員浪潮,目前大型數字巨頭似乎沒有預見到這一點。
正如預期的那樣,與微軟和 OpenAI 競爭的是谷歌,它將推出Bard ,這是來自DeepMind 的聊天機器人,該公司已被谷歌的Alphabet收購。 Bard 看起來就像是 ChatGPT 的精確副本,但沒有更新缺陷。
谷歌 CEO 桑達爾·皮查伊 (Sundar Pichai)介紹了這款新軟件,它是一種從網絡上獲取信息以提供新鮮、高質量回復的工具。他所說的“新鮮”是指不斷更新,這是微軟的 AI 仍然無法做到的。
簡而言之,Bard 的目標是爲簡單的問題生成詳細的答案。它的操作基於LaMDA ,即對話應用程序的語言模型,谷歌自己的一位工程師之前曾將其描述爲“有感知力”。
不可否認,谷歌宣佈推出巴德是科技愛好者們期待的。畢竟,根據《華爾街日報》的報道,谷歌母公司 Alphabet 在 2021 年在人工智能方面的投資超過310 億美元,超過任何其他競爭對手。
在 ChatGPT 取得成功後,該公司因此決定召集最優秀的人才:創始人拉里佩奇和謝爾蓋布林。無論如何,毫無疑問,人工智能軟件是創新領域的寶貴資源。
的確,即使是亞馬遜、Meta 和蘋果,也肯定不會坐視別人在做什麼而不採取行動。然而,雖然競爭在研究方面是一個很好的加速器,但也存在這樣的風險,即在最佳人工智能的競賽中,存在錯誤、侷限性和風險的有缺陷的系統將被使用,而不會過多關注全局。