魯俊群:由ChatGPT現象看中美產業鏈和科技創新之爭
——從開源生態系統視角觀察AI大模型
- 發布時間:2023-09-26 11:20:28
- 來源:中國社會科學網
2022年底,Open AI推出Chat GPT,迅速火遍全球,上線僅兩個月注冊用戶就達到1億,引發全民關于AI大變革的討論。
同時,人們對于Open AI在成立時承諾專利和研究成果全部開放,而現在又不開源代碼表示疑慮。Open AI未來是否會開源代碼?開源生態系統在塑造產業鏈和科技創新方面到底扮演了什么角色?在創新機制上又有哪些可學習借鑒之處?中國是否應該發展自己的AI大模型?發展路徑應該如何選擇?本文嘗試從開源生態系統的視角來觀察AI進化的邏輯。
一、開源生態系統的發展歷史與國際現狀
開源是軟件開發中的一種模式,指基于開源許可證的要求開放源代碼。這一開發模式允許他人使用、拷貝、修改以及重新發布源代碼,在其基礎上創新、優化、迭代。
開源文化具有開放、平等、共享、協作、貢獻、合規等特點,也是一種先進的大規模的智力協同創新協作模式,并已從軟件開發延伸至更多領域。
開源軟件從上世紀80年代發展至今,經歷了從理想主義模式、服務商業模式,再到如今的多元商業模式等多個階段(如圖)。開源的歷史是軟件創新自由和版權收益之間不斷斗爭和平衡的歷史,也是處在開源與壟斷不斷循環之中。服務器操作系統、云計算、大數據、人工智能等新技術都在近幾年逐步走向開源。
在國際上,開源的重要性已得到廣泛認可。開源體系成為西方國家打造數字經濟新優勢的戰略選擇。以美國為例,美國對開源生態的建設強調體系化,借助開源幫助政府降低采購成本,開源的發展與研發的突破結合緊密,開源常引導新技術的發展方向。美國政府于2002年開始布局開源生態的建設。從2004年起美國出臺了一系列指導政府部門使用開源軟件的政策。在2016年和2019年的《人工智能研發戰略計劃》中均提出,要開發開源軟件庫和工具包;政府部門不但要支持和使用人工智能開源技術,還要為開源項目貢獻算法或軟件。
市值超過千億美元的國際龍頭企業也紛紛布局開源。IBM以340億美元收購了開源軟件企業RedHat,微軟以75億美元收購了Git Hub。除此以外,Oracle、Adobe等巨頭也紛紛收購開源軟件企業,布局開源生態。
二、美國Open AI誕生Chat GPT的內部運行機制:開源和閉源的博弈、理想主義和商業利益的平衡
2015年底,OpenAI宣告成立。它是以捐贈款成立基金會支持的非營利性實驗室,目標是開發“通用人工智能”技術。到2019年時,捐贈款項已無法支撐運營成本,OpenAI成立了一個以盈利為目的的分支機構,并與微軟達成投資協議,在股權架構與利潤分配上創造了一種與眾不同的結構。
(1)微軟新一輪投資完成、Open AILP首批投資人收回初始投資后,微軟有權獲得Open AILP75%的利潤;
(2)微軟收回130億美元投資、從Open AILP獲得920億美元利潤后,分享利潤的比例從75%降到49%;
(3)OpenAILP產生的利潤達到1500億美元后,投資方的全部股權轉讓給Open AI的非營利基金。
2022年底,Chat GPT成功發布。可以說,微軟用上百億美元的投資“租了Open AI”。等Open AI開始賺大錢之后,微軟能直接分錢。但如果Open AI變得極其賺錢,就能拿回微軟手中的股份,不再受其制約。
在目前階段,OpenAI變得不那么開放,為了保護其知識產權和收入來源,開始放棄發布所有研究成果和開源代碼的承諾,理想主義讓位于商業利益。
三、中國開源生態的現狀以及面臨的問題和挑戰
我國目前已積極在開源領域展開布局,出臺了多部政策、法規。很多地方政府也在產業發展規劃方案中對開源進行了布局。
開源技術發展、開源基金會的建設等出現在多部“十四五”規劃中,包括《“十四五”數字經濟發展規劃》《“十四五”國家信息化規劃》《關于規范金融業開源技術應用與發展的意見》等。多個地方政府,如浙江省、湖北省政府等都在各自的“十四五”數字經濟發展規劃中將開源技術納入了發展藍圖。
開源生態能夠為我國創新能力體系的建設添磚加瓦。利用與歐美開源模式的差異化發展,我國有機會打造中國特色的開源生態,吸引國際開發者和投資者。但同時中國的開源系統發展也面臨多個問題和挑戰。
第一,目前,中央和地方在開源建設上的步調還不一致,例如有的地方政府鼓勵國際開源社區落地,而忽略了自主建設開源生態的機會。開源體系和對草根創新力量的保護是創新賴以生存的土壤。開源項目可以很好地集中個體的創新能力,保護個體創新的變現權益,可以匯聚全國甚至全球的個體創新者的智慧,對社會面的創新有極大的幫助。我國計算機相關行業工作者數量龐大,目前還沒有將草根創新力量聚攏起來。在科技領域,還存在重復建設、重復投資的情況,沒有將創新力量體系化。
第二,科技公司的商業競爭阻礙創新開發。為了搶占市場先機,各大科技公司仍主要關注項目的商業利益,對開源的長期價值缺乏認知,企業之間并未建立信任,不利于打造開源環境。同時,即使是在開源項目上,傳統的開發方式仍然很普遍,小部分利益相關者起主導作用,不符合開源的利他主義思想和開源生態系統的建設。
第三,對開源機構的行政干預措施仍需優化。目前開源社區、開源基金會等受到較強的行政干預。例如,有的開源基金會目前歸部委相關司局管理,但司局的管理范疇和協調力度不足以支撐該基金會向更多的行業和應用場景延伸。同時,部委對基金會采取行政化管理方式,對于需求層層審批,對發展重點并不明確,使得開源機構工作方向不清晰,項目運作效率低下。開源基金會的管理層由部委指派,缺少社會力量的參與,使得開源模式利用民間創新能力的初衷沒有得到體現,同時基金會的背景對于與國際科技企業協商合作也受一定影響。
第四,開源機構缺乏核心競爭力。國家級的開源生態倡導機構,例如開源基金會,缺少優質項目以及開發能力等核心競爭力,無法吸引更多企業加入合作。部分大企業在接觸開源機構時也因此顯得更為抵觸,更傾向于保護自身的商業利益。
四、開源生態系統對于塑造產業鏈和科技創新的意義
開源緣起于奉獻和利他的理想主義。開源精神也是一種共享共治的精神,一種打破壟斷、開放創新的精神。開源在國際上是作為一種開發模式。軟件的開發模式與物理世界的資源開發存在根本的不同,開源的開發環境和理念有機會吸引國際開發者協作共贏,并且在外交和國際合作領域可以產生新的國際影響。
開源體系是重組全球要素資源、優化全球價值分配、改變全球競爭格局的戰略選擇。具體而言,開源對于創新活力、產業生態、經濟發展都具有重大意義。
第一,開源有助于激發創新活力。開源的模式能夠匯聚社會中的創新力量,“眾籌”草根的創新能力。例如,操作系統領域,全球90%以上服務器操作系統和72%以上移動操作系統均基于開源Linux內核;電動汽車領域,在特斯拉將其代碼向全球開發者共享后,全世界范圍內迸發出許多電動車企業,促進了電動車行業全球產業鏈的發展。開源也已成為云計算、大數據、人工智能、區塊鏈、元宇宙等新興領域的主要開發模式。
第二,開源能夠重塑產業生態。開源的項目能夠號召和匯聚全社會的力量對其做創新和迭代,從而超越產業中原來的優勢者,有機會重新塑造產業生態。例如,在手機的移動操作系統領域,安卓系統憑借開源的優勢,快速迭代和擴散,擊敗了塞班系統,2013年全球裝機量就達到80%。
第三,開源能夠賦能經濟發展。歐盟測算發現,開源軟件的投資平均可帶來4倍回報,開源貢獻者數量每增加10%,年度GDP將提高0.6%。
五、中國開發類Chat GPT大模型的問題和挑戰
Chat GPT的問世極大推動了AI時代的發展,將給人類社會生活和生產帶來巨變。中國企業在大模型上也展現出極高的開發熱情,目前國內至少已經有30多家公司有大模型亮相,其中不乏參數規模甚至超過ChatGPT規模的大模型,涵蓋了互聯網巨頭、AI上市公司、服務器龍頭企業、科研院所與一些創業公司。
國內AI大模型呈現出以下幾個技術特點:
第一,采用預訓練模型提高泛化能力。中國的大模型通常采用預訓練模型,使用大量未標注的數據對模型進行訓練,從而使得模型具有更好的泛化能力和適應性。目前,BERT是最常用的預訓練模型之一,不過也有其他模型如GPT-2、XLNet等。
第二,多任務學習方法,提高不同領域的效果。中國的大模型通常采用多任務學習方法,讓一個模型同時處理多個任務。這種方法可以使得模型能夠更好地學習不同領域的知識,從而提高模型的效率和準確性。
第三,結合知識圖譜,增強理解能力。中國的大模型通常會結合知識圖譜進行應用,以增強模型的理解和推理能力。此外,有些模型還會引入實體鏈接、關系抽取等技術,以更好地理解文本。
第四,建立訓練平臺,訓練規模大。中國的大模型通常需要大規模的訓練數據和計算資源才能達到較好的效果。為此,一些企業和機構建立了自己的訓練平臺和超算中心,以支持大規模訓練。
在模型的開源情況上,華為的盤古大模型、復旦大學的MOSS模型、商湯科技的書生2.5模型、鵬程系列的大模型、智譜GLM-130B模型等目前開源,而諸如百度的文心一言、阿里、騰訊、字節跳動等互聯網大廠的大模型均未開源或未披露。
目前,中國大模型的發展存在諸多問題,這些問題不但影響大模型的發展,也不利于創新體系建設。
第一,科技企業“千模大戰”競爭激烈,商業利益降低開源意愿。各個科技公司只顧“自家門前雪”,關注商業利益,而抗拒加入開源生態。據有的開源基金會的調研,科技巨頭中僅有華為對開源大模型展現出興趣,其他大公司均以商業利益等緣由拒絕透露技術信息。這也導致各個公司存在模型重復開發、重復建設的問題,一家公司取得的突破難以惠及其他公司和開發者。
第二,大模型的開發能源消耗巨大,入場門檻高。大模型的訓練依賴于大量的數據計算和超算體系。然而超算耗電量巨大,并且目前中國的超算體系效率比較低。盡管超級計算機的建設方興未艾,峰值理論算力達到了世界第一,但實際利用率不足。同時,大模型訓練所產生的能源消耗也給當地帶來較大的環境壓力。
六、對開源生態和AI大模型發展的政策建議
第一,國家相關部門對開源生態,以及開源生態對科技創新和塑造全球產業鏈的戰略意義提高認識,做好開源生態的頂層設計,加大力度培育科技創新的土壤。相關部門應認識到開源對于創新的重要性及開源開發模式所帶來的社會生產模式的改變。除了更好地發揮舉國體制集中力量辦大事以外,開源也是建設科技創新土壤的重點,需要將開源生態的發展提到戰略高度,中央和地方統一步調,致力于打造中國的開源生態,提出行業標準,保護和匯聚社會創新草根力量,爭取培育出中國版的OpenAI。
第二,在人工智能模型的開發上,鼓勵科技公司加入開源生態,集合開源的力量,助力中國的類ChatGPT大模型的發展。人工智能大模型不僅僅是人類的工具和助手,更是人工智能時代新的操作系統,是人工智能的底層架構和基礎設施。中國必須發展出自己的大模型,要充分認識其重要意義。同時,要客觀、真實地分析影響企業開源的因素,在開源前,鼓勵各企業之間建立定期溝通交流機制,將開發技術的信息脫敏后充分交流,并且探討如何建立開源后的協同運營管理機制。對于大模型的開發,還應當進行多維度的思考。借助開源社區和社會創新力量,積極探索其他的人工智能發展道路。大模型是否是通用人工智能發展的唯一正確的路徑,是否有更低能耗、更高效率的技術途徑,仍需要進一步探索。例如,可以考慮從生物神經網絡的認知邏輯結構入手,尋找更好的通用模型。
第三,積極培養開源人才,建設開源文化。推動開源社區、開源基金會等機構與高校、科技企業、研究院等機構合作研究;舉辦全球性質的開源大賽,選拔優秀人才,展示創新成果,傳播普及開源理念,對青少年開展開源文化的教育,為推進開源生態繁榮和可持續發展提供動力和支撐。
第四,鼓勵地方政府為開源社區、開源機構提供落地支持。地方政府為開源機構提供包括辦公地點、資金支持、算力支持、知識產權優惠政策、人才政策等支持,助力開源機構提高自身核心競爭力,與開源機構互助互利,合力建設中國特色的開源生態系統,為科技創新和科技自立自強注入強大動能。(作者單位:清華大學人工智能國際治理研究院)