首頁 女生 都市言情 遊戲公司?這分明是科技巨頭

第499章 AI進度

  

  陳騰將AI部門負責AIGC部門的負責人給喊了過來。

  所謂AIGC,是ArtificialIntelligenceGeneratedContent的首字母拼音。

  翻譯過來,就是「人工智慧生成內容」。

  顧名思義,AIGC這類AI的作用,就是生成一些內容。

  2022年以後大火的GPT,就是最廣為人知的AIGC。

  除此之外,還有AI作畫、AI生成視頻,都在AIGC的範疇之中。

  在AIGC大火的時候,許多人認為一個全新的時代將要到來。

  畫畫、寫作、作曲……這類創作性的工作,由AI就能夠完成。

  然而理想很豐滿,現實很骨感。

  陳騰在這些AI工具大火的時候,也玩過幾次。

  隻不過再嘗試幾次之後,就會發現這些AI工具存在著重大的缺陷。

  文字類AI生成的內容牛頭不對馬嘴。

  上一秒說過的話,下一秒就會忘記,記憶短得像是七秒鐘記憶的魚一樣。

  在算力達到一定程度之前,AI對於上下文內容的記憶能力永遠都小得可憐。

  不過用來寫些沒什麼意義的檢討、總結、日報周報,還是相當不錯的。

  以及在寫代碼的時候,生成一些簡單的代碼。

  圖片類AI生成的內容同樣存在一些問題。

  比如說早期一直被詬病的手部細節,比如說隻能生成動漫類型的圖片。

  一旦生成寫實類的圖片,就會顯得非常失真。

  用來做輔助工作還行。

  要是想要靠AI獨立地完成一些任務,還有很長的路要走。

  2022年的AI水平尚且如此,2015年的AI水平就更加不用說了。

  不過現在能邁出第一步,陳騰還是非常感興趣的。

  「老闆,您找我?」

  眼前的男人四十歲不到,叫做魏龍,是國內人工智慧領域的一位專家。

  他從騰達做手機語音助手的時候,就來到了騰達。

  在語音助手這一塊,做了相當多的工作。

  技術水平是有口皆碑的好。

  「對,我聽朱岩哲說你們推出了一個AIGC的測試版本?」

  「是的,目前我們的對話大模型暫命名為DH,版本號為0.1。」

  「DH?」

  「對話的首拼。」

  「原來如此。」陳騰笑了笑,「那這個DH0.1現在大概處於什麼樣的水準?」

  「對話的智力水平……大概隻有幼兒園小朋友的水平吧。」

  陳騰微微點頭。

  這個水平,的確不高。

  也難怪版本號是0.1,而不是1.0。

  「你覺得如果我們這個DH0.1如果需要提升,目前最欠缺的是什麼?」

  「數據。」魏龍毫不猶豫地回答道,「絕對是優質的數據,我們這個模型的水準還是不錯的,就是數據實在是太少了。」

  「數據嗎……」

  陳騰倒是沒懷疑魏龍說的模型水準。

  因為這個DH模型的基礎,其實是【LSM人工智慧語言學習大模型】。

  就是陳騰上次五連抽,在系統上抽到的那個。

  系統出品,怎麼都不會太差勁的。

  在抽到這個大模型之後,魏龍手下的技術團隊又基於這個模型做了一定程度上的改進。

  所以模型水準陳騰是非常信任的。

  不過模型的學習能力強是一回事,數據又是一回事。

  如果將模型比作一個人,優秀的模型就是天賦很高的天才。

  可就算是頂級的天才,沒有高質量的學習資料,能學到的東西也有限。

  現在騰達的這個DH模型,缺乏的就是學習資料。

  「我們現在的數據源有哪些?」

  「就是各大平台上網友們交流的一些數據,比如短視頻平台的評論區,直播平台的彈幕。不過這些數據的質量,實在是太低了。」

  陳騰微微點頭。

  魏龍說的很有道理。

  短視頻平台的評論區,有相當多的一部分評論都是沒什麼意義的回復。

  這個沒意義,指的是對AI訓練沒意義。

  比如顏值博主的評論區什麼「好美」「好漂亮」的誇讚。

  對於AI訓練來說,意義不大。

  經過篩選處理過後,能用的數據少得可憐。

  陳騰又想到了GPT。

  實際上第一代的GPT是在2018年推出的。

  但是第一代的GPT在市場上,並沒有攪動什麼風雲。

  因為智能水平太低了,根本沒有人樂意與這樣的AI對話。

  直到四年之後,足足餵了四年的數據,這才有了許多人願意對話聊天的GPT。

  可見AI的學習與發展,是一條十分漫長的路。

  「如果按照現在的學習速度,你覺得我們的AI需要多長的時間,才能通過圖靈測試?」

  所謂圖靈測試,就是讓一個人去問AI問題。

  看看這個人,能否發現正在與自己聊天對話的是AI。

  能發現是AI,則未通過圖靈測試。

  未能發現是AI,則通過圖靈測試。

  這個測試方法在學術界具備一定的爭議。

  有人覺得這是一個很好的測試手段,有人則覺得這種測試手段沒什麼必要。

  但是不管怎麼說,圖靈測試都可以作為一個AI智能程度的一個指標。

  能通過圖靈測試的人工智慧不一定特別有用,但至少具備一定的智能程度。

  「如果按照現在的學習速度,通過圖靈測試的話大概需要兩年吧。如果數據的量充足且優質,也許兩三個月甚至更短的時間就能通過圖靈測試了。」

  魏龍有些無奈地說道。

  優化模型、輸入數據。

  他們搞人工智慧的,無非就是在做這兩件事情。

  「我倒是有一個想法,可以試一試,我們可以在互聯網上,將DH0.1偽裝成普通的用戶,讓真人用戶和DH0.1對話試試。」

  「可是DH0.1現在的水準,恐怕和正常人聊上幾句,就會讓人覺得聊天內容牛頭不對馬嘴了。」

  「那有什麼關係?」陳騰反問,「你現在上網去和人討論問題,牛頭不對馬嘴的情況難道遇到的少嗎?」

  魏龍:「……」

  還真別說,他確實在互聯網上見證過生物多樣性。

  「那我們就偽裝成真人,去和用戶聊天?」

  「嗯,你去找蔣華,讓他配合你們弄些人機賬號出來吧。」

  「好的。」

  「什麼時候你們覺得這個對話模型有資格被稱之為DH1.0了,我們就向用戶正式開放我們這個對話模型。」

  「如果能和大量真人進行對話,我覺得一年以內,甚至半年的時間我們就能達到1.0版本。智力水平,應該有七八歲小孩子這麼高。」

  「那還不錯。」

  陳騰對七八歲小孩子的智力水平還是認可的。

  至少能對話了。

  如果在這個基礎上再進步,那就真的可以商業化了。

  

目錄
設置
手機
書架
書頁
評論