如何選擇適合企業需求的大語言模型

2024.09.17

LLM正在推動各行各業的突破和效率。在選擇一種模型時,企業應該考慮預期的應用、速度、安全、成本、語言和易用性。

雖然與其他人工智慧(AI)技術相比,生成式AI比較新,但它已經被用於支援從審查求職者到診斷和推薦疾病治療的一系列任務。 IDC預測,到2028年,80%的資訊長將依賴生成式AI工具來加速分析、促進決策和改善客戶服務等。

企業正在競相挖掘這項技術的潛力,以提高客戶滿意度和員工生產力。為此,它們正在考慮使用最適合支援生成式AI應用的大語言模式(LLM),例如AI copilot和聊天機器人。

了解LLM的多樣性

如今市面上有大量的LLM可供選擇,這意味著企業更有可能找到適合自己特定需求的LLM,而不是求助於一應俱全的LLM。這可以加速創新,不過從數百種模型中選擇合適的模型可能很複雜。

在選擇LLM時,企業應該考慮其預期的應用、速度、安全、成本、語言和易用性。

模型類型包括:

  • 商業模式:在醫療保健和金融服務業很流行,這類模型通常用於涉及專門定製或安全限制的項目。
  • 開源模型:由於可訪問性和成本優勢,這類模型經常被新創公司和小型企業用於研究。
  • 通用模型:這類模型使用大量資料加以訓練,可以用作建立客製化AI應用程式的基礎模型。
  • 針對特定領域的模型:這類模型經過訓練以適應特定的行業或用例,例如醫療保健或金融服務。
  • 針對特定任務的模型:這類度身定制的模型針對單一自然語言處理(NLP)功能進行了最佳化,例如摘要、答案或翻譯。
  • 視覺語言模型:這類模型被稱為VLM,結合了電腦視覺和NLP,從文字描述中產生圖像,並從圖像中識別物體。同時使用文字和程式碼讓它們可以在不直接使用視覺資料訓練的情況下創建和理解圖像。

考慮模型的大小也很重要,因為這將影響其功能和限制。一些因素包括如下:

  • 推理速度:較小的模型通常提供較短的推理時間,實現即時處理,提高能源效率並節省成本。
  • 準確性:使用檢索增強生成(RAG)改善的大型模型常常會獲得更高的準確性。
  • 可部署性:較小的模型非常適合邊緣設備和行動應用程序,而較大的模型最好在雲端或資料中心運行。
  • 成本:較大的模型需要更多的運算基礎設施來運作。

開發者也應該基於誰將使用AI模型、應用於何處,考慮AI模型必須支援哪些語言。這在現代工作場所顯得特別重要,因為員工可能會說多種不同的語言。確保模型能夠無縫翻譯語言對於使用者之間的有效溝通和協作至關重要。

此外,隨著主權AI越來越重要,許多國家正在建立使用當地語言和資料集訓練的專有模型。這使各國能夠對AI保持控制權和自主權,確保這些技術的開發和應用符合其獨特的文化、道德和法律標準。

企業如何使用LLM?

LLM支援各種AI應用,包括聊天機器人和預測分析工具,這些應用正在各行各業帶來突破和效率。

  • 醫療保健業: Insilico Medicine是一家基於生成式AI的藥物發現公司,它開發了一種新的LLM轉換器:nach0,用於回答生物醫學問題,並合成新分子。這種多領域模型使研究人員能夠有效率地處理和分析大型資料集,減少記憶體需求,提高處理速度,促進更有效的資料管理和組織。
  • 電信業: Amdocs正在使用其amAIz平台來提高業務效率,推動新的收入流,並改善客戶體驗。這包括一款客戶計費代理,便於用戶立即享用基於LLM的數據洞察和自動化,以解決客戶計費問題。
  • 金融服務業: Bank Negara(又稱BNI)正在整合Cloudera的AI Inference服務,以便使用生成式AI增強客戶體驗,並提高營運效率。這將使BNI能夠在安全的企業環境中有效地部署和管理大規模AI模型,並提供高效能和資料隱私。

針對特定需求量身定制的不同模型允許快速實施AI解決方案和工具,以幫助自動處理冗餘工作。這為人們騰出了更多的時間和空間,以便專注於對公司和組織帶來價值的項目。

展望未來,開發者將竭力建置和部署能夠增強產業特定應用的LLM,致力於改善系統之間的互通性,降低營運成本,並提高效率。使用量身定制的LLM,企業可以建立滿足其獨特需求的AI應用程序,以提高客戶滿意度,並促進卓越營運。