NVIDIA推出兩大型語言模型雲端AI服務

NVIDIA（輝達）宣布推出兩項全新大型語言模型（Large Language Model，LLM）雲端人工智慧（AI）服務，分別為NVIDIA NeMo LLM服務與NVIDIA Bio NeMo LLM服務，讓開發人員能夠輕鬆地調整LLM，並部署用於內容生成、文字摘要、聊天機器人、程式碼開發，以及預測蛋白質結構和生物分子屬性等客製化的AI應用程式。

NeMo LLM服務讓開發人員能夠在NVIDIA管理的基礎設施上，使用被稱為快速學習（Prompt Learning）的訓練方法，迅速自訂調整一些預先訓練好的基礎模型。NVIDIA Bio NeMo服務是一個雲端應用程式介面（API），它將LLM的使用範圍擴大到語言之外的科學應用範疇中，以協助製藥和生技公司更快開發新藥物。

NVIDIA創辦人暨執行長黃仁勳表示，LLM具有改變各行各業的潛力。調整基礎模型的能力將讓數百萬名開發人員能夠獲得LLM強大的力量，無需從頭開始建立龐大模型，就能開發語言服務並推動科學發現。

NeMo LLM服務透過快速學習提高準確率並加速部署作業開發人員使用NeMo LLM服務，便能使用自己的訓練資料自行調整基礎模型，模型大小從30億個參數到Megatron 530B（這是世界上最大的LLM之一）。跟過去從頭開始訓練一個模型所需的數週或數個月相比，使用NeMo LLM服務只需幾分鐘到幾小時即可完成。

開發人員使用快速學習來自行調整模型，而快速學習採用一種名為p-tuning的技術。開發人員只需使用幾百個範例，就能快速地自行調整基礎模型，而過去則要使用數十億個資料點來進行調整。在客製化的過程中會產生特定任務的提示權杖（token），然後將權杖結合基礎模型，為特定使用範例提供更高的準確性與更相關的回應內容。

開發人員可以使用同一個模型對多個使用範例進行客製化調整，並產生出多個不同的提示權杖。Playground功能提供了一個無需編寫程式的選項，可以輕鬆地對模型進行實驗及互動操作，進一步提高將LLM用於特定產業使用範例的有效性和可取得性。

準備好部署後，調整好的模型便能在雲端執行個體、企業內部系統或透過API運行。

Bio NeMo LLM服務包含兩個用於化學和生物學應用的全新Bio NeMo語言模型，可用於支援處理蛋白質、DNA和化學資料，幫助研究人員發現生物序列中的模式並取得寶貴洞察。

Bio NeMo讓研究人員能夠透過內含數十億個參數的模型來擴大其研究工作範圍。這些更大的模型可以儲存更多關於蛋白質結構、基因間進化關係的資訊，甚至可以生成用於治療的新型生物分子。

雲端API讓研究人員能夠使用Megatron 530B及其他現成模型除了調整基礎模型外，LLM服務還能讓研究人員透過雲端API來使用現成和客製化的模型。

如此一來開發人員便能接觸到眾多預先完成訓練的LLM，包括Megatron 530B，還能接觸到透過NVIDIA NeMo Megatron框架所建立的T5和GPT-3模型（該框架現已進入公開測試階段），以支援廣泛的應用程式和多語言服務需求。

汽車、電腦運算、教育、醫療、電信等產業的領導業者正使用NeMo Megatron，為客戶提供中文、英文、韓文、瑞典文及其他語言的服務。

NeMo LLM、Bio NeMo服務及雲端API預計將於下個月開放搶先試用。開發人員現在可以申請加入，以瞭解更多細節。

NeMo Megatron框架測試版可透過NVIDIAN GC取得，其經過最佳化調整可在NVIDIA DGX Foundry和NVIDIA DGX SuperPOD，以及Amazon Web Services（AWS）、Microsoft Azure與Oracle Cloud Infrastructure的加速雲端執行個體上運行。開發人員可以在NVIDIA LaunchPad實驗室中，免費體驗NeMo Megatron框架。