Reddit 數據 DAO 以及有關 Gen AI 模型訓練的所有知識

Cryptonomist 採訪了Vana's 的首席執行官兼聯合創始人 Anna Kazlauskas,該公司推出了Reddit Data DAO 第一週就有 14 萬名用戶使用經過驗證的 Reddit 帳戶註冊。Anna 現在正在與開發人員合作,爲 LinkedIn 和 ChatGPT 等其他平臺構建數據 DAO。

除了 DAO 之外,他們還有其他渠道供用戶將他們的數據彙集到數據集中,然後可用於 GenAI 模型訓練,例如創建肖像或頭像

除了 Vana 所做的事情之外,我們還與 Anna 討論了去中心化人工智能領域的發展,因爲平臺可以幫助人們使用數據並將其貨幣化以用於新的應用程序。

Vana 是一個由用戶擁有的數據驅動的用戶擁有的 AI 平臺。我們的使命是讓用戶擁有自己的數據,並通過 AI 模型創造價值。爲了提高 AI 模型的性能,對更多訓練數據的需求日益增長,因爲最終 AI 模型的好壞取決於其數據。

例如,LLaMA 3 的訓練數據約爲 15 萬億個單詞,這大致相當於公共互聯網上可用的數據量。現在,各大公司正試圖獲取更多數據,有時甚至爲此花費數億美元。各大科技平臺都在囤積有價值的用戶數據,並在不考慮用戶許可的情況下構建新技術,這阻礙了創新。

在 Vana,我們將數據從這些封閉的花園中解放出來,將其置於用戶的控制之下。我們允許用戶直接爲 AI 模型做出貢獻,選擇如何使用他們的數據以及 AI 的使用方式。我們相信,如果我們能夠訪問最好的數據,我們實際上可以超越領先的模型——通過訪問只能直接從用戶那裏獲得的數據來超越 GPT-6 等模型的性能。Vana 的架構是第 1 層區塊鏈,從頭開始設計用於私有的、用戶擁有的數據。

從採用的角度來看,Reddit Data DAO 取得了令人難以置信的成功,第一週就有超過 14 萬名用戶註冊。這種採用水平對於 DAO 來說並不常見——它現在是歷史上最大的數據 DAO。

推動快速採用的原因之一是,隨着新聞報道數據銷售,用戶越來越意識到其數據的價值,故事的大部分內容已經展開。意識到 Reddit 以 2 億美元的價格出售您的數據或 Apple 以 5000 萬美元的價格購買數據,您會更加意識到其價值。

此外,人們對基於 web3 構建的用戶自有產品有着強烈的需求,這些產品超越了人們熟悉的DeFi產品,進入了新的所有權領域。我們在 Farcaster、DePIN 網絡和基於 Vana 構建的數據 DAO 等項目中看到了這種趨勢,它們代表了新一波用戶自有產品。

一個重要的教訓是需要證明貢獻要求。超過一百萬人試圖加入 Reddit Data DAO,但許多人不符合擁有 Reddit 帳戶、存在一定時間且擁有最低數據量的標準。這凸顯了建立機制以確保高質量貢獻的重要性。

Vana 是一個針對用戶擁有數據的點對點網絡,構建者創建了各種數據 DAO,例如 Reddit 數據 DAO、LinkedIn 數據 DAO 和 ChatGPT 數據 DAO。

這些不同的數據源對於訓練AI模型來說非常有價值,但它們目前被封鎖在封閉的圍牆中。從這些平臺獲取數據可能非常棘手,但由於數據監管,這始終是可能的。

我們的目標是幫助用戶同時將數據變現和保護。例如,藉助 Reddit Data DAO,他們現在正在訓練一個用戶擁有的模型(目前主要專注於發垃圾帖子,但這只是一個開始)。每次使用該模型時,用戶都會獲得報酬,從而爲模型的共同所有權創造了經濟激勵。

而且用戶數據保持完全私密——數據不是出售,而是被“出租”,底層數據永遠不會離開安全環境。

數據隱私已不再僅僅是一個意識形態或偏好問題,而是一個經濟問題。如果有人擁有你的數據,他們就有可能創造出一個具有經濟價值的人工智能版本,賺取收入並可能與你競爭。這就是爲什麼隱私對 Vana 如此重要和核心。

我們發明了一個概念,稱爲“非託管數據”,它類似於非託管錢包,但用於存儲您的個人數據。它使您的數據完全受您控制,並由您的私鑰授權。這使您的數據可以在應用程序之間移植,並在其上添加一個原生金融層,從而可以構建數據 DAO 之類的東西。

通常,AI 模型使用從公共互聯網上抓取的數據進行訓練,這些數據無需登錄即可獲得。但如果你從教孩子瞭解世界的角度來考慮,你不會希望他們只是隨意地在公共互聯網上閒逛。你會想給他們提供可能不公開的高質量信息,比如高質量的寫作、思維過程或信息。AI 主要在公共數據上進行訓練,但它確實需要私人數據來推動前沿發展。這就是數據 DAO 所實現的:用戶貢獻他們的私人數據來創建用戶擁有的 AI。

我們認爲,人工智能應該像開源軟件一樣由社區創建。我們的目標是讓研究人員能夠訪問目前被禁錮在封閉環境中的最佳數據集,以推動人工智能性能的進步。

過去一年,去中心化 AI 領域發展確實加速。例如,今年在 EthCC 上,幾乎每天都有去中心化 AI 活動,而去年沒有。人們正在研究如何將對金融領域效果良好的自主技術應用到 AI 領域。在 Vana,我們認爲所有這一切的核心基礎是數據。要構建用戶擁有的 AI 和自主 AI,您需要用戶擁有的數據,因此我們的重點是該數據部分。

在未來的 5-10 年裏,我對幾個里程碑感到興奮:1)由 1 億人共同擁有的用戶擁有的基礎模型。2)更多可以自行賺錢的自主 AI 代理,並確保這些代理真正由爲訓練它們做出貢獻的用戶擁有。

隨着人工智能發揮越來越重要的經濟作用,確保從技術和社會角度的權力得到廣泛分配。

Vana 是一個無需許可的網絡,因此任何人都可以構建數據 DAO。它是專爲私有、用戶擁有的數據而設計的第一層區塊鏈。目前,Satori 測試網上部署了 100 多個數據 DAO。許多構建者都是 Bittensor 生態系統的早期參與者,他們深刻理解加密和 AI 的交集。一些值得注意的項目包括 Twitter Data DAO、LinkedIn Data DAO 和 GitHub Data DAO。我們還與 ZK 領域和 DAO 工具領域的項目合作,使數據 DAO 更易於創建和管理。

我認爲,當今人工智能領域最大的問題之一是誰應該擁有模型並決定將哪些數據輸入其中。隨着我們開始越來越多地依賴人工智能獲取信息,它們成爲我們的真相來源。決定將哪些數據輸入人工智能的人實際上就是在決定真相。由一個實體控制這一切是可怕的。在 Vana,我們的觀點是,應該由社區而不是一家公司來做出這些決定。

去中心化 AI 的另一個問題是:如果 AI 完全去中心化,那麼如果 AI 失控並且沒有關閉按鈕怎麼辦?我們在 Vana 處理這個問題的方式是,AI 模型最終歸爲其貢獻的用戶所有,因此他們始終保持完全控制權。

現在是開始在去中心化 AI 領域進行構建的好時機。有很多機會將一些在 DeFi 中效果良好的加密經濟原語應用於新興的去中心化數據和 AI 類別。我還建議花一些時間深入研究非加密、開源 AI 領域,以瞭解人們在加密環境之外採取的一些方法。我會親自研究一些現有項目,看看有哪些原語可供構建,包括嘗試在 Vana 上啓動數據 DAO。

推薦閱讀

相關文章

甚至 Vitalik Buterin 也分享了他對美國大選的看法

幾天前,就連加密貨幣界最知名的人物,以太坊聯合創始人 Vitalik Buterin,也想對即將於 11 月在美國舉行的總統大選發表自己的看法。布特林並沒有公開支持任何一位候選人,但他想警告選民,真正支持加密貨幣世界並不意味着僅僅進行宣傳。

VanEck 在美國提交 Solana ETF 申請(美國)

比特幣ETF發行人VanEck近日已向美國提交了ETF Solana的申請。 VanEck 數字資產研究主管表示,該公司是美國首家申請 Solana ETF 的公司,標誌着加密貨幣熊市投資牛市領域邁出重要一步。讓我們看看下面的所有細節。

幣安:尼日利亞監獄管理員感染瘧疾風險

被關押在尼日利亞兩個多月的幣安高管蒂格蘭·加巴里安 (Tigran Gabaryan) 的家人透露,他可能患有瘧疾。美國公民加巴里安被指控洗錢和逃稅。據報道,幣安高管蒂格蘭·加巴良(Tigran Gabaryan)的家人透露,他懷疑自己患有瘧疾。美國公民加巴良因涉嫌洗錢和逃稅,在尼日利亞監獄被關押了兩個多月。

候選人羅伯特·肯尼迪收購 GameStop (GME) 公司

昨日,美國總統候選人、比特幣和加密貨幣世界的著名支持者羅伯特·肯尼迪 (Robert F. Kennedy Jr.) 決定購買價值 24,000 美元的 GameStop (GME) 股票,以表示對美國散戶投資者的支持。

Meta、特斯拉和微軟的新聞和股價

我們監測新聞和價格的報道延伸到股市,今天我們將仔細研究三大公司及其股票情況:Meta、Tesla 和 Microsoft。讓我們從 Meta Platform Inc (META) 公司開始第一個分析,我們可以將其最近幾個月的表現評估爲非常積極。僅以最近30天爲參考,META的價值就上漲了19.19%。

埃隆馬斯克:推特試驗暫停

伊隆馬斯克被法官批准暫停推特訴訟,規定必須在 10 月 28 日之前與社交網絡達成協議,否則訴訟將恢復。埃隆馬斯克:推特提起的訴訟暫時被正式擱置在特拉華州衡平法院監督此案的麥考密克法官已批准埃隆·馬斯克關於中止訴訟的請求,前提是與 Twitter 的交易在 10 月 28 日之前完成。