宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

2024年04月19日 首頁 » 其他

        經常上網的朋友都知道,「弱智吧」已經成為了網際網路的一大寶地。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        在這裡,網友們會一本正經的提問一些非常「睿智」的問題。看著這些奇奇怪怪的言論,有時候你真的很難理解他們的腦迴路。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        但神奇的是,在弱智吧刷帖的時候,大傢伙的智商也會被強行調整到同一水平線上,並且針對這些弱智問題延伸出自己的想法。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?
全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        或許正因為這種「誰都能摻一腳」的參與感,這幾年來弱智吧在網際網路上都有著不小的熱度。

        例如去年《王國之淚》發售,由於新增的「究極手」物理系統自由度過大,玩家們總是能在遊戲裡整出一些「降智操作」。恰好那時候「弱智吧」也有點熱度,所以那段時間,大家紛紛將自己的弱智操作上傳到影片平台上,開始爭搶弱智吧吧主的寶座。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        而就在前兩年AI勢頭正猛的時候,也有網友用弱智吧的言論開始挑戰起了人工智慧。當然結果可想而知,就連人類都無法理解的想法,更別說AI能夠整明白了。所以就在幾輪比試之後,AI最終還是甘拜下風。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

不能(斬釘截鐵

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

很明顯沒看懂兩個「文明」的不同含義

        雖說這個「弱智吧大戰人工智慧」 起初只是網友們的整活吧,但這事兒好像還真引起了不少專業人士的注意。

        而就在經過了一段時間的研究,他們發現——欸,弱智吧好像還真有成為最強中文AI訓練數據的潛質。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        最近,一個研究團隊在arxiv上發布了一篇論文,內容大概是研究怎麼樣去建造一個高質量的中文AI訓練數據集。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        由中科院深圳先進技術研究院、中科院自動化研究所、北京大學、滑鐵盧大學等眾多高校組成的聯合團隊發布

        在文章中,他們認為目前中文的數據集很多都是從英文翻譯過來的,並不符合中文的語境和文化。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

AI不理解中文語境鬧出的笑話

        所以為了解決這一問題,研究團隊收集了包括知乎、小紅書、豆瓣以及弱智吧等不少問答社區的討論,建立一個中文的數據集。

        這些收集到的數據需要進行嚴格的篩選提取出高質量的問答,同時也需要相互比較,分析誰才是最適合成為中文AI語料庫的素材來源。

        而就在一番評估下來,數據顯示:使用弱智吧數據進行訓練的大模型,跑分遙遙領先於其他數據集。

        從表格中可以看到,弱智吧的數據集從問答、頭腦風暴、分類等總共8項測試中都拿到了非常高的分數,可以說是一騎絕塵。相比之下,同為論壇類型的知乎、豆瓣這些資料庫得分則遜色不少,小紅書分數甚至是最低的。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        「最弱智的貼吧,卻是最睿智的AI訓練庫」,這種強烈的反差一下子吸引了不少網友,同時也傳到了弱智吧吧友們的耳朵里。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?
全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        而貼吧官方甚至也開啟了一場「弱智吧大戰人工智慧」的挑戰,頗有種看熱鬧不嫌事大的感覺。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?
全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

真不愧是弱智吧吧友

        然而,這場狂歡尚未結束,有網友就對這項研究的可信度提出了質疑。

        他們發現,無論是從數據量還是收集數據的方式來看,弱智吧的數據都有著非常大的獨特性。

        首先,可以看到弱智吧參與訓練的僅僅只有240組數據。相比於其他平台動輒三四千的數據,弱智吧的好像有些太少了。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        此外,從論文中對於弱智吧數據的介紹可以看到,他們所收集的僅僅只是弱智吧的標題,而相應的回答則用ChatGPT4產生。如果說所有平台的回答都是用GPT生成的倒還好,但關鍵是所有的數據集中,只有弱智吧的回答是用AI生成的。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        正因為以上這些原因,網友們開始質疑起了實驗的可信度,認為用GPT4的回答再用GPT4評分,無異於既當運動員又當裁判員,會產生很大的偏差。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        對此,參與研究的相關人員也表示,他們做此研究的主要目的是讓模型學會辨別邏輯漏洞和邏輯推理,然而弱智吧部分回答並不適用訓練模型,所以他們決定用GPT輔助重新構造回答。而對於「評估偏差」這一問題,他們也計劃在下一版論文中補充人工評估實驗,以減少偏差。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        這樣看來,研究或許還處於一個比較初步的階段,而弱智吧的言論是否能夠成為最強的中文AI語料庫,可能還要很長的一段時間才能得以驗證吧。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        不過回過頭來,我發現弱智吧的一些言論還真的有點東西,至少比抽象話和抖機靈等言論更能夠讓人產生思考。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        有時候來到吧里轉上一圈,你會對其中的幾句話琢磨很久,甚至還會讓你產生「弱智吧里真的都是弱智嗎?」這樣的想法。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?
全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        例如吧里有不少帖子都包含了雙關語、一詞多義等的內容,雖然看上去很扯,但從字面意義上來看,有些描述還真的挺合理的。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?
全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?
全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        此外,不少帖子提出的問題還有很強的邏輯聯繫,沒點邏輯學的功底,好像還真想不出來這些問題。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?
全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?
全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?
全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        甚至一些看上去弱智的想法,在弱智吧吧友的解構和創作之下,變得富有哲理和詩意,讓人看了一眼就不能忘記。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?
全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?
全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?
全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

        這樣看來,弱智吧的這些具有邏輯性的言論,對於中文語境的AI模型來說,的確是一個很好的訓練方向。

        而如果真的有一天,AI能夠完全理解並運用弱智吧的這些問題的話,我想離AI全民化的時代真的就不遠了。

全網智商最低的弱智吧,竟有望成為最牛的中文AI資料庫?

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新