【照片為聊天機器人測試畫面,與正文沒有直接關系、 圖=蘋果經濟】
超越短期輸入記憶,儲存對對方的長期記憶,深度對話Meta Blenderbot2.0, Talkie的 Bonds, NAVER Clova Care Call等由於建模的負擔,仍處於初級水平,但它將成為未來至關重要的技術。
文:金洪基
隨著對話功能的聊天機器人技術日益發展, 聊天機器人正在成爲日常的另一個合作夥伴。 但大部分都是透過一問一答式的提詞器進行片面的對話。
最近,韓國最大的開發者大會「DEVIEW 2023」上發表了有趣的內容。 聊天機器人最大的問題是長期記憶問題。 目前使用 LLM 的聊天機器人可以理解多種模式的上下文。 這是因為前面的句子包含在輸入中。 然而,儘管短期記憶是可能的,但聊天機器人往往會忘記時間過長的事情。
最近,以對話對象的前後情況和之前進行的對話爲基礎,可以談論未來事情的所謂長期記憶聊天機器人技術日益發達,因此備受關注。
Meta已經通過Blenderbot2.0實現了這一點,最近作爲日常對話AI應用程序人氣很高的Talkie也通過另外的Bonds功能儲存了對對方的長久記憶,並將其用於對話。 在國內,Naver Clova Care Call作爲不亞於他們的長期記憶聊天機器人也大受歡迎。
可以進行人生諮詢程度的深度對話
不是簡單地詢問老人昨晚怎麼樣,而是詢問他們的健康狀況,例如「您已經服用○○藥很長時間了,這些天感覺怎麼樣?」這幾乎就像是專門諮詢。 它確實可以說是比大多數親戚或孩子更親切的機器。
當然,有人指出,現有的ChatGPT和Bard等正在努力長時間儲存先前與對話者共享的文本,但未能達到這一水平。
Naver的Clova Care Call是打電話給老人家並監測異常徵兆的服務。 首先把對話內容進行簡要的保存。 然後下次對話中利用已儲存的內容進行對話。 比如說,上次你好像得了感冒, 現在感冒好了沒有。
Talkie的Bonds具有克服這些限制的長期記憶功能。 每次進行對話時,不斷地產生概括單詞和上下文的文章,從中選擇想記住的。 但是,目前最多只能有4個句子。
專家指出,實際上, 以目前的技術不可能將長期記憶的文章全部輸入到提示器中。 結合Chat GPT和RPA技術的企業Worktronics的一位相關人士表示:模型的最大輸入規模有限, 費用也太大了,目前,只有類似於實時提問的記憶會儲存相對較長的時間, 然後 在搜尋提示下一起使用
【圖=Naver】
Naver Clova Carecall是最領先
與此相比, Naver Clova Carecall展示了進一步發展的技術。 正在推出向老人們問候並監測異常徵兆的AI服務。 這是使用Naver的超大型AIHyperClova的結果。
Clova Carecall還把長期記憶的文章作爲提示一起放入其中,生成提問文章。 由於該技術尚未公開,對於選擇特定句子僅將其輸入長期記憶,還是一次性輸入所有長期記憶,專家們意見不一。
但是很多人認爲:這也是以Hyper Clova爲基礎,選擇適合目前對話脈絡的長期記憶的過程,似乎也是Hyper Clova。
Meta Blenderbot2.0, 受嵌入方式限制
由Meta創建的 Blenderbot 2.0 也使用長期記憶。 這裡採用的方法是將匯總的內容作爲嵌入式儲存,直接適用於模型運算的方式。 這與儲存文章本身,一次性輸入提示器的Naver Clova形成了鮮明的對比。
專家們預測,今後隨著具備這種長期記憶能力的聊天機器人技術的進一步發展, 這種能力將變得至關重要。 為了實現這一目標,別無選擇,只能以LLM為基礎。
如果模型規模小,就要像Meta的Blenderbot一樣,以嵌入方式儲存記憶, 但是就像現在的Blenderbot一樣,這種方法的靈活性差,學習也很難。 因此很多專家認為「把一切交給超級人工智慧會更方便」。
要做好使用大模型和高成本負擔的心理準備才能實現
開發人工智慧聊天機器人服務的Mayfarm組長權某(音)表示:日常化AI的長期記憶比功能型AI更重要。因爲如果不記得我的話,就無法形成關系。
這意味著該公司也在長期考慮這種技術。 他說: 「但從國內角度來看,有技術和經濟問題,首先模型性能一定要好。 」
他也表示:爲了很好地整合儲存的文章和現在的文脈,大模型比較有利,概括記錄文章時,還需要重復、不一致、整合、刪除等過程,究竟會帶來多少類似於現在 對話的記憶,也會對性能產生很大的影響。
但是,隨著提示的增加,費用也會隨之增加。 盡管如此,長期記憶才是日常對話AI的最後一個拼圖,明年支持這一拼圖的服務將會更多!