大模式發展之路:向左還是向右?
ChatGPT一發布,便迅速在全球掀起了新一輪的人工智慧熱潮。這款現象級的應用不僅是一項科技產品,更是標誌著一場科技革命的到來,背後的大模型正以前所未有的方式改變著我們的世界,並成為了眾多科技企業競相追逐的焦點。
然而,在這場圍繞大模型的科技熱潮中,不同的技術選擇、商業策略和發展理念也引發了廣泛的討論與爭議。
開源閉源之爭
在大模型領域,開源與閉源的爭議尤其突出。在國外方面,特斯拉創始人馬斯克曾對OpenAI及其CEO薩姆·阿爾特曼(Sam Altman)等人提起訴訟,稱他們已放棄了公司的最初使命,即開發人工智能以造福人類而不是為了利潤。據報道,馬斯克提出了包括違約、違反信託義務和不公平商業行為在內的索賠,並要求該公司恢復開源。
國內方面,百度創辦人、董事長兼執行長李彥宏是閉源的堅定支持者。今年4月,他在Create百度AI開發者大會上演講時表示:“大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的。所以開源模型會越來越落後。”
對此,週鴻禕公開反駁:「我是一直相信開源的力量,至於說網路上有些名人胡說八道,你們別被忽悠了。他說開源不如閉源好?連說這話的公司自己都是藉助了開源的力量才成長到今天。
百川智能CEO王小川則在微信群中表達了觀點。他認為,開源和閉源並不像手機中iOS或安卓作業系統只能二選一。從To B角度,開源閉源其實都需要。
實際上,這些爭議並非非此即彼的選擇,而是需要根據企業的實際情況、市場需求和技術趨勢來綜合考慮。開源模型憑藉其開放性、創新力和高透明度,贏得了許多開發者和企業的青睞。同時,閉源模型則以其出色的性能和嚴格的智慧財產權保護,滿足了企業對高效能和專業服務的需求。
通用垂直之爭
通用大模型與垂直大模型之爭,也是大模型領域的重要議題。通用大模型憑藉其廣泛的適應性和強大的學習能力,能夠處理多種任務,從文本生成到情感分析,在多個領域展現廣泛的應用潛力。
例如,GPT可以透過大量的文本資料來學習自然語言的規律,具有極高的語言生成能力和自我訓練能力,廣泛應用於自然語言處理領域。 BERT作為一種先進的預訓練語言模型,模型能夠同時考慮前後文的上下文信息,從而更好地理解語義和語境,主要用於處理文本分類、問答系統、命名實體識別和語義相似度計算等任務。
與一般大模型相比,垂直大模型則以其專業性強、落地速度快的特點,在特定領域內佔優勢。
例如,華為雲盤古大模型就將重塑千行百業作為發展方向。值得一提的是,在今年的華為開發者大會上,華為雲端正式發表了盤古大模型5.0。據悉,華為雲盤古大模型5.0的應用已延伸至自動駕駛、工業設計、建築設計、具身智慧、數位內容生產、高鐵、鋼鐵、氣象、醫藥等多個產業及場景。
再例如,京東推出的言犀大模型立足於產業研發。京東方面稱,言犀大模型具有更高產業屬性、更強泛化能力、更多安全保障,將深入零售、物流、金融、健康、政務等知識密集、任務產業場景,解決產業實際問題。
可以說,通用大模型與垂直大模型各有優勢,它們在不同的場景和需求下發揮不同的作用。
自研調用之爭
自研大模型與呼叫第三方大模型服務的爭議,同樣值得關注。自研大模型能讓企業掌握核心技術和智慧財產權,形成獨特的競爭優勢,但需要龐大的投入和長時間的研發週期。僅從訓練成本來看,根據《ChatGPT 需要多少算力》中估算,GPT-3訓練一次的成本約為140萬美元,對於一些更大的LLM模型,訓練成本介於200萬美元至1200萬美元之間。
相較之下,呼叫第三方大模型服務可以快速實現業務需求,降低研發成本和風險,但也可能受限於第三方服務的穩定性和可控性。例如,OpenAI明確表示從7月9日起,將阻止來自未列入OpenAI支援的國家和地區清單的API流量。這意味著,先前希望能藉助OpenAI大模型套殼創業的公司,將迎來巨大打擊。
由此可見,自研與第三方大模型服務的選擇取決於企業的策略定位、資源條件以及對核心技術的需求。
寫在最後:
我們可以看到,圍繞大模型技術的爭議不僅反映了不同企業在技術選擇、商業策略和發展理念上的差異,也為整個產業的未來發展提供了多元化的機會。對於身處大模型領域的廠商而言,無論是開源與閉源的抉擇,通用與垂直的定位,還是自研與調用的戰略考慮,都需要根據自身實際情況和市場趨勢做出選擇。