〈工業技術與資訊〉全球及國內生成式AI 現況與發展機會

撰文/工研院產業科技國際策略發展所分析師 石立康

自去年底 ChatGPT 問世之後,讓不同國籍的普羅民眾,也開始能輕易使用 AI 在其生活或工作環境中。ChatGPT 於開放註冊後,在 5 天內就達到百萬個使用者,用戶成長速度比 Instagram 快 15 倍,比 Spotify 快 30 倍,最終僅兩個月就讓總用戶人數突破 1 億,每天約 1,300 萬個活躍用戶,且付費升級版的 ChatGPT Plus 服務還因為需求太大,發生暫時停售的現象。

知名新創研究機構 CB Insights 在今年 2 月初發布今年的 11 大科技趨勢時,就已經提過生成式 AI 會是今年的重大主題。但羅馬實非一天造成的,自 2017 年起全球對生成式 AI 創投不論是案件數跟金額皆呈現上升趨勢,在去年達到最高。視覺媒體、生成介面、文字、語音、程式撰寫,更是其中五大熱門領域。

在 2022 年 8 月也有重要的轉捩點,新創 Stability AI 對大眾發布 Stable Diffusion(Text-to-Image 工具),吸引數百萬使用者並讓該工具成為網路熱門話題,對 Google、Meta 及 OpenAI 等造成壓力,OpenAI 在 9 月開放 Dall-E 2,於 11 月開放 ChatGPT 給公眾,不過 Google 跟進在今年 2 月推出 Bard 聊天機器人時,因回答問題失誤率高,導致股價暴跌近 8%。同時間很多新創也在開發自己的生成式 AI 工具,包括 C3.ai、BigBear.ai 和 SoundHound AI 等股價也受市場追捧。中國搜尋引擎龍頭百度也跟進在 3 月推出「文心一言」(Ernie Bot)聊天機器人,也造就了目前大家觀察到的爆發潮。

國內生成式 AI 現況及潛在應用

目前國內程式撰寫、文案生成、靈感啟發、藝術教學、動畫創作相關產業公司,已直接受益在工作中導入 ChatGPT 進行人機協作,生成式 AI 因在對話問答具優異表現,使金融、電信、客服等也率先導入。如玉山金以 ChatGPT 取代原客服對話機器人,也用其進行企業確認客戶身份的程序(Know Your Customer),讓顧客開戶時間大幅縮短;另有電信業者正與華碩旗下的台智雲合作,使用自有資料再透過開源模型,建置自用的客服對話機器人;還有部分企業希望直接掌握優化過的大型模型,避免未來被外商壟斷,如聯發科、中研院、國教院三者合作使用開源 BLOOM 模型進行繁體語料再訓練與優化(訓練資料為原先 1,000 倍),該模型已公開讓外界下載,未來可用於問答系統、文字編修、廣告文案生成、華語教學、客服系統等。

雖然臺灣缺乏基礎模型開發所需的資料量、算力、財力等,在此方面難與國際大廠競爭,但不論是在「基礎模型」或「客製模型」兩方面,國內廠商也還至少各有方案可選擇適合者使用。

臺廠可直接連接國際大廠 Microsoft 或 Google 的 API,此時導入生成式 AI 成本低且立即可用,但不易客製且僅能透過雲端使用,未來資訊會留在雲端,也將面對未來服務可能斷鏈的風險。臺廠也可用國際大廠雲端訓練工具,自行上傳資料來調整大型模型,可符合特定領域需求,但同樣有服務斷鏈風險。臺廠亦可用開源模型結合自有資料,微調模型後建置應用,能提供最安全、正確的服務,但有賴多次訓練且算力需求不低,優點是可掌握核心技術,若不想將資訊留雲端,也可將模型佈署在企業內部,避免洩密與資安問題。但此時需要一家本土企業擔任「AI 代工廠」角色提供不同規模基礎模型、合理算力價格及訓練顧問服務。

除前述所提的金融、電信、客服外,從生成式 AI 特性來看,國內尚有多種其他應用,如醫療、照護、心理諮詢、法律服務、補教機構、製造場域、IC 設計與資訊軟體、電商、3D 設計與動畫、音樂創作、新藥物及新材料開發、政府服務等亦適合在未來導入,提升生產力。

國內後進者的發展機會所在

對通用型生成式 AI,前面提過模型參數規模大、所需資料量多、所需算力、財力高,身為國內後進者的確難與國際大廠競爭,但這也並非代表國內後進者沒有機會。據研究文獻、實務經驗、算力、標記資料量等因素來觀察,若是用在特定領域的生成式 AI,模型參數約落在 1B 至 20B 之間即有相當競爭力,此為國內後進者可考慮積極發展的一個可行技術區間。

以 BioMedLM 為例,該模型為史丹福大學基礎模型研究中心(CRFM)和 MosaicML 兩者聯合開發,可用於醫學任務問答。例如可生成簡明相關的問題來總結患者的需求,該模型是基於 GPT-2 的小型模型,以美國國立衛生研究院線上生物醫學數據庫論文摘要和全文訓練而成,該模型在美國醫學院學生成為醫生須通過的醫學執照考試中取得最佳的 50.3 分,表現勝過多種大型模型,但 BioMedLM 參數 2.7B,僅通用型生成式 AI 的數十分之一。

此現象說明在特定領域資料上重新訓練小型模型,可表現得跟大型者一樣好或更好;但所需資料量、算力、成本相對少很多。其他如程式撰寫的 CodeGen、圖像生成的 DALL-E 及 Diffusion Model 等表現突出的生成式 AI 模型,也都落在此區間中。而部分臺灣特定產業如高科技設計或製造業,基於保護商業機密、資安等考量,不想將機敏資訊留在雲端,必不會考慮使用國際大廠的雲端方案,這也創造出特定領域生成式 AI 的本土需求,可交由本土廠商解決。

轉載自《工業技術與資訊》月刊第 377 期 2023 年 9 月號,未經授權不得轉載。