解構百度智慧雲端千帆AppBuilder,預見下一代大模型應用

2024.01.10

嘉賓|百度智慧雲端技術委員會主席 孫珂

撰稿 | 雲昭

2023,如果將全球科技比喻為一首雄渾熱烈的交響曲,那麼大模型無疑成為了最為激越人心的主旋律。而與海外大模型的幾大巨頭你追我趕的激烈競爭敘事不同,國內的大模型發展與創新的軌跡方向,似乎看百度就夠了。

領航者與追隨者之間的差異就是創新。距離3月16日文心一言發布以來,百度一直在大模型賽道上狂飆向前,遙遙領先。從文心產品的全社會開放、插件矩陣的推出、再到10月媲美甚至部分超越GPT4的文心一言4.0的正式發布、AI原生應用的提出,每一步都成為了中國大模型創新的風向標。

然而創新永無止境,正在人們苦苦思考如何迎接2024這個AI原生應用爆發之年時,百度再一次讓業界見證了虹吸效應的威力:12月20日,在2023百度雲智大會·智算大會上,百度放出一記大招,宣布AI原生應用開發工作台-百度智慧雲端千帆AppBuilder全面開放服務。

七天后,51CTO有幸受邀來到百度大廈,得以採訪在智算大會上為大家展示分鐘級構建AI原生應用的重磅人物——百度智能雲技術委員會主席孫珂。

創新是一個觀察與驗證的過程

AppBuilder的推出,“整體而言,這是一個觀察和驗證的過程。”

在回想這個開發平台的研發過程時,孫珂用了這樣一句簡單的話來概括。繼續追問之下,背後的故事浮現。

「因為在百度內部,一直都在圍繞大模型做各種各樣的應用嘗試。在這個過程中,我們逐漸發現它的應用架構和一些功能是趨同的。而且隨著基於EB4的能力逐漸體現,我們進而發現這種能力可以實施為分層的架構。”

先前據悉,透過文心大模型,某位客戶甚至在三分鐘內就開發完成了官網客服。「在提前一兩個月的時間,我們觀察到這一趨勢,並在8月份左右確定這是一個值得推進的方向。隨後,我們開始建立平台和產品,並在10月世界大會上展示了原型。然後,進一步梳理了產品結構和概念,並於12月20號正式開放。”

一款大幅降低AI原生應用門檻的開發工具,就是這樣在觀察與驗證的過程中誕生的。

百度眼中的AI原生應用樣貌

正如同雲端運算像雲端原生演進一樣,當「應用程式+AI」邁向AI原生應用程式時,到底哪裡發生了變化呢?

孫珂認為,現在提“AI原生應用”,更多代表了一個基於AI驅動應用的全新時代,就如同大家提“移動應用”一樣,並沒有固定的形態。

然而,我們可以從AI驅動的業務形態去逐漸讓「AI原生應用」的樣貌清晰起來。

首先我們看到的是基於AI去做創作能力,再有就是去做問答型、知識獲取和推薦的能力。這是兩個常見的業務形態。再往下延伸,使用者就會基於AI去完成更複雜的任務,例如GBI,這方面就可能會由Agent來完成。

此外,AI原生還有一個比較擅長的事情,就是可以加速現有的應用程式操作,就像Robin經常會講的,我們的GUI(圖形使用者介面)選單應該縮減到二級以內。

例如我們在製作PPT時的繪圖操作、文字樣式編輯工作等場景時,往往需要到三級選單才能找到一個功能。那麼AI原生應用來之後,這些常見的功能的GUI介面上的所展示的Button的層級,可能最多只有兩級,而無需再切換到任何的table頁,極大提高操作效率。

現在的AI與應用程式怎樣結合才能更「原生」呢?孫珂提出了一個很形象的「P圖」的例子。他認為,在Photoshop中,現在一些複雜的操作流程和固定的任務,例如人像摳圖等,繁瑣且耗時,都可能會演進成透過對話框來完成。

“將這些功能隱藏在AI原生的能力背後,透過簡單的自然語言描述,就可以快速自動地去完成這些操作。”

而對於簡單的任務,例如摳完圖像的位置挪移,用戶還是會希望用滑鼠來挪動,而不是用語言指令去讓AI實現。

複雜功能交給AI,讓使用者更專注於創作與創意。“這是一個理想的AI原生的結合方式。不管是基於Agent驅動,還是說做操作增強,未來的產品如果沒有這些AI原生的功能,可能會喪失很多競爭力。”

因此,我們可以預見到一個非常廣闊的全新場景,AI原生的結合方式可以深入到各行各業中,它將成為未來產品的重要組成部分。

解構AppBuilder,預見下一代大模型應用

AI原生應用程式的前景已經鋪開,又該如何打造一款適合AI原生能力的應用開發架構呢?

我們注意到百度千帆推出的Appbuilder給了最早的三個框架:RAG、GBI、Agent。孫珂提到,之所以選擇這三個,是基於「市場需求驅動產品」的核心邏輯去做出的判斷。

首先,為什麼第一時間做RAG框架?這裡有兩點原因。第一,「目前在做大模型應用的玩家,不一定只做RAG,但一定會做RAG。」孫珂告訴51CTO,目前Appbuilder的用戶有八成以上的都在做RAG,因此,一定要優先幫助用戶解決最關注、最普遍的需求。第二,RAG又恰好是一個業界公認、相對較穩定的大模型應用框架,可以用來解決大模型在發布以後一系列的痛點問題,例如幻覺問題、穩定性問題。這些東西業內本來就是很公認的,相對比較穩定的大模型的應用框架。

其次,對於GBI,市場需求也出乎意料的廣泛,自10月17日百度世界大會上發布後,申請百度GBI的線索蜂擁而至。孫珂指出,目前GBI有著不同層次的需求,有開發者、整合商,甚至有些終端使用者也會對此場景有強訴求。同時,孫珂認為,GBI是「RAG再往下走、大模型深度應用」的重要里程碑。相較於RAG“用自然語言產生自然語言”,GBI則能夠用自然語言產生SQL語句,幫助使用者進行程式化操作。大模型非常需要這樣的框架。一方面,很多人希望把它作為資料庫可直接詢問表格的完整應用;另一方面,它會整合到各種各樣的AI原生應用裡面去做一些零部件,甚至RAG內都會集成GBI,比如,在搜尋的文檔中含有表格,就會需要使用GBI來進行詢問。

最後,對於Agent,孫珂表示,它是下一代大模型應用的雛形。雖然現在市面上的agent可能還沒有很完善,但它是大模型未來發揮應用價值的重要方向。Agent能夠將大模型對世界的感知、對語言的感知轉化成一系列行為操控的動作,去分解、執行和操控,最終成為一個真正的助理。現在市面上Agent有大量的開發需求和應用需求,開發框架也不少,「選擇Agent,目的是讓大家先能用起來,然後隨時反饋,我們也會根據反饋去快速優化它,最終期望呈現給大家一個強大、普適的Agent能力。”

總之,AppBuilder選擇這幾個架構都是基於市場需求和未來發展前景的考量。“未來如果有更多的框架值得探索,百度團隊將繼續探索,最終目標是加速大模型應用的開發。”

越過“科技落地線”,百度會打造超級AI應用嗎

一個時代到來的背後,總有著一條科技落地線,只有越過這條線,才能解鎖超級應用程式。就像賈伯斯拿出了觸控螢幕的iPhone那樣,讓使用者跨入了擁有了更靈活、更流暢操作的行動智慧時代。

同樣,放眼國內大模型,百度ERNIE-Bot 4.0有理由最有可能先達到並且越過這條落地線。孫珂表示,百度在AI原生應用方面具有領先優勢,包括從底層架構到模型效果的全方位能力。而且基於這些先發優勢,百度會持續保持領先地位。

具體來講,百度在晶片、框架、模型、應用這四層佈局中,晶片和框架這兩層本質上對應的是性能,決定著模型的用戶規模上限,因為性能一旦做好,成本就可以做到足夠便宜。

孫珂表示,很多大模型呼叫並不便宜。「剛才提到的的Agent和GBI,背後都必須要基於EB4(ERNIE-Bot 4.0),而且每一條後面都要調六七次EB4,累加起來調用費用較高。要降低每一次的呼叫成本,最終保證所有人都能用得起這些複雜的AI原生應用,百度有著底層的天然優勢。”

模型和應用這兩層,體現在模型的整體效果上,考驗的是大模型真正高級的能力,國內橫向去看,無論是GBI、還是Agent,百度的ERNIE-Bot 4.0能力還是最強的。

底層實力的優勢也造就了前瞻的實務優勢。例如,百度在AI雲方面,如何將AI能力封裝成適當的形態快速提供給開發者,都有獨特的認知與經驗。

那麼,AI超級應用會出自百度嗎?

這個問題有些左右互搏。但其實從百度整體立場來看,更多是希望別的公司做出來爆款的AI原生應用的。“不一定是百度自己做出來的,也會有別人做出來,我們更多提供的是基礎設施。”

正如Robin在百度內部演講中所提到的,因為百度比別人先走一步,希望把百度的能力和Know How標準化和產品化以後開放給社會,提供給更多的人,做出優秀的AI原生應用。

此外,在孫珂看來,AI原生的超級應用並不只會有一款、兩款,在未來會有多個爆款應用。

“身處一個繁榮的AI時代,任何應用都肯定掩蓋不了其他應用的光芒。”

一枝獨放不是春。孫珂真正期待的是,基於AppBuilder等工具與平台,大家一起把AI原生應用程式的時代真正推向爆發與繁榮。“對於百度智能雲、AppBuilder而言,我們最優先關注的還是如何幫助開發者提效,我非常樂見開發者去把AI原生應用程式做出來。”

AI應用開發者,需要更多的自由度

提及AppBuilder的設計理念,孫珂表示, AI應用程式開發者需要更多的選擇和自由度,因此將框架和元件都做成了可擴展和可拼接的形式。

「如果只給你一套穩定的框架和一種切片策略,明顯是不夠的,還有許多工作要做。就像我之前在發布會上演示的簡歷助手,在做RAG之前,開發者還需要對簡歷做一些其他處理,讓大模型去進行別的操作,然後再去做檢索。”

正是基於這些訴求,一成不變的框架肯定是沒法解的,因此需要讓這個框架變得可以被開發者根據自身來隨意拼接。故而,百度團隊將框架進行了一系列的開源。

 除此之外,框架裡的每一個零件,也就是組件,包括各種模態的組件全部都被整理出來,令開發者做到任意插拔,無論前序、後序都可以去擴展和定制能力。

此外,據悉AppBuilder有兩種形態:程式碼態和低程式碼態,其中低程式碼態工具會優先提供最常見的業務邏輯,但不會完全放棄程式碼態的開發方式。孫珂對此表示,“低程式碼態並不會完全取代程式碼態,因為開發者對於業務邏輯的調整需求仍然存在。”

AppBuilder真正的理念,並不是說簡簡單單的幫開發者做出來一個AI應用,而是期望讓開發者能夠在平台上找到開發一個完整的AI原生應用所有的工具和套件。

此外,AppBuilder也針對不同類型的開發者提供了不同的服務策略。

首先,有能力自己開發的開發者,包括頭部網路企業和一些AI原生應用開發能力強的企業。這類企業對雲端的依賴程度不高,使用私有雲,也不太可能使用公有雲服務。

其次,針對沒有能力獨自開發的開發者,主要包括傳統企業和資源型企業,他們需要外部服務商來提供服務。這類企業可能對雲端訴求較不強烈,自身開發能力相對較弱,因此也不是直接客戶,而是間接客戶。

然後,孫珂表示,AI原生應用開發工具核心目標客戶群包括ISV(獨立軟體開發商)和to B創企,這些客戶主要服務於一產、二產私有化大客戶和數量龐大的二級客戶,如餐廳、超市等。

此外,該平台也將中腰部網路企業作為服務對象。這些企業可能有自己的障礙和資源,但同樣有企業智慧化和資訊化建設的訴求。還有一些致力於做to C業務的AI創企也是目標客戶之列,這些客戶可能需要對某一些技術有自建的需求,需要快速搭建應用。

孫珂認為,這些客戶群的行為畫像幾乎一致,都是具備一定開發能力的企業和個人,他們使用應用框架和API快速搭建自己想要的內容,但服務的目的可能不同。

總的來說,針對不同類型的開發者,平台提供了不同的服務策略,以滿足他們的不同需求和特徵。

小步快跑,加速開發者AI應用構建

圍繞在低程式碼態和程式碼態兩個方面,孫珂介紹了AppBuilder下一步的產品規劃。

在低程式碼態方面,AppBuilder主要針對開發能力相對較弱的開發者,幫助他們加速應用程式建置。為了實現這一目標,AppBuilder會持續增強其能力,提高靈活性,例如透過增強Agent、GBI和RAG的任務配置能力等。此外,AppBuilder還會開發更多連接器,幫助開發者將應用程式發佈到不同的終端場景,如靈境等。

在程式碼態方面,AppBuilder主要是為深度開發者提供高效率、穩定的介面和輔助開發工具。這些工具包括IDE、調試環境等,以便開發者能夠更好地開發、調試和優化應用。同時,AppBuilder也會發布更多API和設定選項,提供更好的可玩性和呼叫效率。此外,AppBuilder也會開放更多開發範本(如cook book),指導開發者如何使用這些API進行應用程式開發。

最後,孫珂提到AppBuilder的迭代速度很快,小版本幾乎每週都在上線。大版本的更新則按月進行,包括發布新功能和優化現有功能。雖然無法給出具體的時間表,但可以確定的是,AppBuilder會持續不斷地推出新功能和最佳化現有功能,以幫助開發者更有效率地進行應用程式開發。

未來:做國內最大的AI原生應用生態

“百度要做到國內最大的AI原生應用開發生態,並期望有百萬級的開發者。”

提及未來AI原生應用開發的未來,孫珂信心十足。在他看來,AI原生應用程式市場將會比行動時代更大,並期望能夠在這個時代裡面做到佼佼者。

首先,他認為不排除會有極客團隊會自己製作鏟子,但真正有實力的玩家數量仍然有限。在開源生態和整個雲端所有開發資源之間的關聯方面,孫珂認為國內相對較弱。

其次,孫珂指出,「做鏟子一個基本的邏輯是,你至少得有一個基礎資源的承載位置,比如你的大模型哪裡承載,BOS在哪承載。放眼國內,我確實覺得可能大廠,特別是雲廠商把這件事做起來的機會更大。”

最重要的是,百度做的不只是一把鏟子,而是一套包括大模型等基礎設施在內的全副淘金裝備,一套真正能夠持續推動和繁榮國內AI原生應用開發生態的創新孵化器。