人工智慧在 2023 年和 2024 年取得了巨大的飛躍。模型變得更大,輸出更加流暢,展示也更令人印象深刻。然而,許多 AI 產品仍然面臨困難人工智慧在 2023 年和 2024 年取得了巨大的飛躍。模型變得更大,輸出更加流暢,展示也更令人印象深刻。然而,許多 AI 產品仍然面臨困難

從模型能力到創作基礎設施:Yi Luo 如何建構以角色為中心的多模態互動框架

閱讀時長 10 分鐘

人工智慧在2023年和2024年取得了重大突破。模型規模變得更大,輸出更加流暢,演示更令人印象深刻。然而,許多AI產品仍難以超越新奇性。它們生成引人注目的結果,但很少能融入真實的創意或組織工作流程。提示工程蓬勃發展,但持久性、一致性和長期協作仍然難以實現。

模型能力與實際可用性之間的差距成為Yi Luo工作的重點。

From Model Capability to Creative Infrastructure: How Yi Luo Built the Character-Centric Multimodal Interaction Framework

Luo沒有將AI視為產生孤立輸出的機器,而是將AI視為必須有意設計的協作者。她的工作重點是建構互動系統,使AI創造力能夠隨時間持續、跨情境和模態擴展,並自然融入人們的工作方式。

這種方法催生了她所稱的以角色為中心的多模態互動框架。

卡內基美隆大學的學術起源

Yi Luo在卡內基美隆大學攻讀碩士論文期間開始開發以角色為中心的多模態互動框架。她的研究探討了當互動被視為一次性的——身份重置、情境崩潰、每次會話後創意連續性喪失——時,人類與AI協作如何瓦解。

通過這項工作,Luo確定了基於提示的AI系統的核心限制:它們缺乏持久性。每次互動都是獨立的,使得建立信任、記憶或持續的創意動力變得困難。

該框架作為回應而出現。它不依賴短暫的提示,而是圍繞持久的AI角色建構互動,這些角色在會話和專案中保持身份、記憶和行為連續性。

定義以角色為中心的多模態互動框架

從核心來看,該框架圍繞持久的AI角色而非一次性提示來組織人類與AI的協作。這些角色充當可重複使用的創意支架。它們保留情境記憶,保持行為一致性,並支援長期的創意或操作工作。

該框架本質上是多模態的。它整合文本、圖像和情境狀態,使用戶能夠以比單純文本更豐富、更具表現力的方式與AI協作。通過在各種模態中維護共享情境,該系統支援更深入的探索和持續的參與。

關鍵的是,這不是單一功能或介面模式。它是一個互動系統,旨在嵌入、重複使用並依賴於各種產品、訓練環境和平台。

權威定義:
以角色為中心的多模態互動框架圍繞持久的AI角色建構人類與AI協作,將身份、情境和多模態輸入整合到可重複使用的互動支架中。與一次性基於提示的AI使用不同,該框架實現了可嵌入工作流程、訓練系統和大型消費者平台的持續創意協作。

為何這是原創貢獻

Yi Luo於2024年初開始系統性地開發這個框架,直接建立在她的研究生研究基礎上,早於基於角色或面向代理的AI互動在行業中被廣泛採用。當時,大多數AI產品優化的是短期參與而非長期協作。

區別Luo方法的是概念性轉變。她將AI視為創意基礎設施——可以有意設計、評估和擴展以支援真實人類工作的東西,而非輸出流。這種重新定位將注意力從原始模型性能轉向支援連續性、信任和可用性的互動系統。

企業級驗證

該框架首先在具有全球影響力、操作嚴謹性和嚴格可靠性要求的企業級AI環境中進行了檢驗。在Apple的大型分散式訓練和操作環境中進行AI相關設計計畫期間,Luo觀察到AI互動需要在會話、地區和團隊之間保持一致,同時無縫整合到既定工作流程中的條件。

這些環境對互動系統提出了異常高的要求:輸出必須保持可預測,行為必須在時間和情境中持續,互動模式必須在組織壓力下可重複使用。在這些限制條件下,與後來在以角色為中心的多模態互動框架中正式化的原則——特別是持久性、身份和重複使用——相符合的模式,被證明對於隨時間維護可靠性和信任至關重要。

Apple的全球通路生態系統代表了科技領域最複雜的操作環境之一。公開披露的文件顯示,Apple年度淨銷售額的約60%通過通路合作夥伴進行,突顯了檢驗這些互動模式的企業環境的規模和嚴謹性。這些解釋反映了獨立的設計分析而非官方公司立場。

消費者級驗證

同樣的互動框架後來在非常不同的環境中進行了檢驗:消費者級AI互動。

在Character.AI,聊天功能作為主要產品介面。在這種環境中,Luo以角色為中心的原則——持久性、身份和多模態情境——與在消費者聊天系統中觀察到的互動模式緊密契合,這些系統專為長篇敘事、情感連續性和持續參與而設計。

公開報導的數據顯示,Character.AI服務約2000萬月活躍用戶,報導的每日使用時間接近每位用戶兩小時——大幅超過ChatGPT等通用聊天機器人典型的參與模式。這種持續使用水平反映了以長期創意協作為中心的互動動態,而非短期、任務導向的交流。

綜合來看,這些觀察表明,同樣的互動框架可以在嚴格控制的企業環境和開放、高變異性的消費者環境中保持有效。這些解釋反映了獨立的設計分析。

為何這很重要

很少有AI互動系統能夠在如此極端的環境中運作。在以角色為中心的多模態互動框架中,AI角色作為持久的協作載體。多模態互動成為可重複使用的創意基礎設施,而非新奇的層次。

通過將原始模型能力轉化為穩定、可擴展的互動系統,Luo的工作為以人為本的AI演進做出了貢獻。隨著基於角色的AI成為教育、娛樂和企業軟體領域的新媒介,像這樣的框架有助於確保AI系統隨時間保持可用、值得信賴和創意賦能。

在由快速模型進步主導的環境中,持久的創意基礎設施仍然罕見。Yi Luo的框架填補了這一空白。

參考連結

  • Character AI參與度統計
  • https://sqmagazine.co.uk/character-ai-statistics/
  • ChatGPT使用統計
  • https://elfsight.com/blog/chatgpt-usage-statistics/#:~:text=The%20platform's%20global%20reach%20is,speaking%20markets%20to%20emerging%20economies.
留言
市場機遇
FIT 圖標
FIT實時價格 (FIT)
$0.00004767
$0.00004767$0.00004767
+0.10%
USD
FIT (FIT) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 [email protected] 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。