近日,中國計算機學會(CCF)推薦的A類國際學術會議 AAAI 論文接收結果公布。中國人民大學高瓴人工智能學院師生有18篇論文被錄用。AAAI (AAAI Conference on Artificial Intelligence) 由國際先進人工智能協會主辦,是人工智能領域的頂級國際學術會議之一。第38屆AAAI人工智能年度會議將于2024年2月在加拿大溫哥華舉行。
論文介紹
論文題目:UniGen: A Unified Generative Framework for Retrieval and Question Answering with Large Language Models
作者:李曉熙,周雨佳,竇志成
通訊作者:竇志成
論文概述:生成式信息檢索(Generative Information Retrieval)在信息檢索和自然語言處理領域引起了廣泛關注,涵蓋了生成式文檔檢索(Generative Document Retrieval,GDR)和基于語境的答案生成(Grounded Answer Generation,GAR)這兩個主要任務?,F有的GDR和GAR方法依賴于獨立的檢索和閱讀器模塊,這限制了同時進行的優化。為了克服這個問題,我們提出了UniGen,一種統一的生成框架,用于檢索和問答,將這兩個任務整合到單個生成模型中,利用大型語言模型的能力。UniGen采用共享編碼器和兩個不同的解碼器,用于生成式檢索和問答。為了促進兩個任務的學習,我們引入了由大型語言模型生成的連接器,用于連接查詢輸入和生成目標,以及文檔標識符和答案之間的差距。此外,我們提出了一種迭代增強策略,利用生成的答案和檢索的文檔循環改進兩個任務。通過在MS MARCO和NQ數據集上的一系列實驗,我們驗證了UniGen的在檢索和問答任務中的有效性。
論文介紹
論文題目:Competition among Pairwise Lottery Contests
作者: 鄧小鐵,甘航鑫,李寧遠,李維安,祁琦
通訊作者: 祁琦
論文概述:競賽理論是經濟學中一個重要分支,旨在研究從競賽者角度設計比賽規則,激勵參賽者達到預期目標。在本文中,我們研究了一個涉及多場比賽的兩階段競爭模型。在這個模型中,每個競賽設計者從候選參賽者中選出兩名參賽者,并賦予偏好系數。同時,參賽者策略性地分配努力程度到其參加的各個競賽中。我們首先證明參賽者存在唯一的純策略納什均衡,并設計算法在多項式時間內求出(1+ε)-近似均衡。其后,我們分析設計者之間的博弈。在每個設計者僅可以舉辦一場競賽,并且同時決定參賽者和偏好系數的情況下,我們發現子博弈完美均衡可能不存在。然而,我們證明當設計者決策拆分為兩個階段時,一定存在子博弈完美均衡。我們還研究每個設計者可舉辦多場比賽的情況,并證明了在合理假設下子博弈完美均衡的存在性。
論文介紹
論文題目:Collaborative Synthesis of Patient Records through Multi-Visit Health State Inference
作者:孫宏達,林宏展,嚴睿
通訊作者:嚴睿
論文概述:電子健康記錄(EHR)在醫療保健中的應用廣泛,但由于隱私和安全問題,真實記錄的利用受到限制。合成EHR數據可以作為替代,但現有方法未考慮不同類型事件之間的關聯,缺乏合成數據各類事件的一致性。同時,現有方法專注于對醫療事件標簽的合成,使得合成數據的應用范圍受限。為解決這些限制,我們提出了一種基于多輪健康狀態推斷的EHR協作合成模型MSIC。首先,我們將EHR合成過程建模為概率圖模型,以捕捉醫療事件之間的關聯。針對多輪合成場景,我們引入潛在健康狀態的推斷方法,實現跨類別合成與縱向合成兩種目標。在事件標簽合成基礎上,我們拓展到醫療報告生成任務,為每個醫療事件合成文本描述,拓寬了合成EHR數據的潛在應用范圍。針對每輪記錄中的不同段落,我們提出了多生成器推敲框架,以協作多個生成器間的消息傳遞,并采用兩階段解碼策略來提升合成報告的質量。在廣泛使用的benchmarks MIMIC-III 和 MIMIC-IV的實驗表明,MSIC在合成數據質量方面取得了最先進的結果,同時保持了較低的隱私風險。
論文介紹
論文題目:What Makes Quantization for Large Language Model Hard? An Empirical Study from the Lens of Perturbation
作者:龔卓成,劉家豪,王金剛,蔡勛梁,趙東巖,嚴睿
通訊作者:趙東巖,嚴睿
論文概述:量化技術作為一種提升大型語言模型(LLMs)內存和計算效率的有力手段,其潛力日益受到重視。眾所周知,性能與效率之間需要權衡,然而量化對LLMs性能影響的深層關系仍有待深入探究。為了解開這一關系的神秘面紗,我們提出了一個全新的量化視角,將其比作是對LLMs權重和激活函數施加的微小擾動。我們將這種方法稱之為“擾動透鏡”。透過這一透鏡,我們對多種人為設定的擾動進行了實驗,旨在探討它們對LLMs性能的具體影響。研究成果揭示了擾動特性與LLMs性能之間諸多的聯系,并提供了對均勻量化失敗情形的新見解,同時也指明了提升量化魯棒性的潛在途徑。為了展示我們研究成果的意義,我們基于這些新見解,實施了一種簡單的非均勻量化方案。實驗顯示,該方案在4比特權重量化和8比特權重和激活量化時,都能實現極小的性能下降。這些實驗結果不僅證實了我們方法的有效性,而且突顯了其在優化LLMs的效率的同時,確保不犧牲性能的巨大潛力。
論文介紹
論文題目:Your Career Path Matters in Person-Job Fit
作者:龔卓成,宋洋,張濤,文繼榮,趙東巖,嚴睿
通訊作者:趙東巖,嚴睿
論文概述:自動化和人工智能技術的快速發展讓我們再次遭遇到新技術進步所帶來的一個棘手問題:人工勞動價值降低,繼而引發失業。鑒于此,自動化的人崗適配系統顯現出促進就業率的巨大潛力。人崗適配的核心目標在于,通過計算求職者簡歷與職位描述之間的匹配得分,判定求職者是否適宜該職位。本文提出了一種創新的人崗適配方法,該方法能夠識別出求職者職業生涯路徑中潛在的偏好。我們識別并應用了職業路徑中的三種偏好類型:一致性、相似性和連續性。我們的研究證實,深入理解職業路徑可以幫助我們為求職者提供更精準的職業建議。為了驗證我們模型的實際應用價值,我們從一家在線招聘平臺提取了真實數據進行了深入的實驗,并通過詳盡的案例分析,闡釋了職業路徑在人崗適配中的重要作用。
論文介紹
論文題目:A Plug-and-Play Quaternion Message-Passing Module for Molecular Conformation Representation
作者:岳昂梟,羅迪新,許洪騰
通訊作者:許洪騰
論文概述:圖神經網絡通過消息傳遞機制有效捕捉分子的屬性和幾何信息,已廣泛應用于3D分子的表征。本文介紹了一種即插即用的四元數消息傳遞(QMP)模塊,它能夠集成到多種現有的3D分子表征模型中,從而提升模型在識別分子構象方面的能力。具體來說,我們的QMP模塊將化學鍵與其相鄰鍵之間的3D旋轉表達為一系列四元數,并通過四元數的鏈式哈密爾頓乘積聚合這些旋轉。所得四元數的實部對分子的全局3D旋轉保持不變,同時對由化學鍵旋轉引發的局部旋轉表現出敏感性,這為訓練分子構象表征模型提供了有效的信息。理論上,我們證明了考慮這些信息的不變圖神經網絡可以區分由鍵扭轉引起的不同構象。此外,我們實現了QMP模塊的高效封裝和加速,將其與現有模型結合只需一行代碼,且計算成本很低。在多個分子數據集上的實驗結果表明,將我們的QMP模塊集成到現有的不變圖神經網絡中,能顯著增強對分子構象的表征,并在下游任務中取得一致且顯著的性能提升。
論文介紹
論文題目:WaveNet: Tackling Non-Stationary Graph Signals via Graph Spectral Wavelets
作者:楊智睿,胡羽藍,歐陽晟,劉敬宇,王書強,馬喜波,Wenhan Wang,Hanjing Su,劉勇
通訊作者:劉勇
論文概述:在譜圖神經網絡的研究中,多項式方法在基于拉普拉斯矩陣的濾波器設計上占據主導地位。然而,由拉普拉斯矩陣析取的多項式組合在信息傳遞中存在一定的限制(如過度平滑),并且多數譜圖神經網絡采用的多項式基也會導致圖譜信號高頻信號的丟失。此外,本研究發現,即使增加多項式階數也無法改變這種情況,這意味著基于多項式的模型在面對高頻信號時存在一定的缺陷。為解決這些問題,本研究打破了多項式方法在譜圖神經網絡設計中的主導地位,并為研究人員引入了一種新的視角。首先,本研究在譜圖信號上采用多分辨率分析,證明了小波對高頻信號的強大擬合能力。然后,本研究利用尺度函數在圖中重構譜信號。進一步,本研究還采用圖像圖表實驗、節點分類實驗以及合成玩具實驗證明了所提方法在學習復雜濾波器方面的有效性、性能優越性以及細小成分捕捉能力的高效性。最后,本研究還對學習到的濾波器進行了可視化,驗證了真實世界數據集的真實濾波器的復雜性。
論文介紹
論文題目:High-dimensional analysis for Generalized Nonlinear Regression: From Asymptotics to Algorithm
作者:李健,劉勇,王偉平
通訊作者:劉勇
論文概述:深度神經網絡的過度參數化常導致良性過擬合(benign overfitting),即在訓練數據上過擬合,但在未見數據上的泛化效果仍然很好。然而,這一現象在非線性回歸上缺乏漸進分析理論框架,同時缺乏與傳統假設空間復雜度之間的關聯。本文提出了一種廣義的非線性回歸高維分析框,證明了隱式正則化參數與經典假設空間復雜度(有效維)的等價關系。理論結果表明,隨著有效維的減小,極限風險會隨之降低?;谶@些理論發現,本文提出了一種名為RFRed的算法。最后,通過多個實驗證實了理論發現和算法的有效性。
論文介紹
論文題目:FedNS: A Fast Sketching Newton-type Algorithm for Federated Learning
作者:李健,劉勇,王巍,王偉平
通訊作者:劉勇
論文概述:最近基于二階優化的聯邦學習算法在通信輪次方面表現出線性收斂。然而,由于海森矩陣的二次通信復雜性,傳輸海森矩陣通常是不可行的。在本文中,我們介紹了聯邦牛頓草圖方法(FedNS)來解決這個問題,同時仍然實現快速收斂速率。通過傳輸基于草圖(sketching)的平方根海森矩陣,代替原始海森矩陣,從而提升通訊效率。基于統計學習理論,本文提供了聯邦牛頓草圖方法的收斂分析,實現了相對于通信輪次的超線性收斂速率。通過多種實驗證實了算法的有效性,實驗結果與本文的理論發現相一致。
論文介紹
論文題目:ASWT-SGNN: Adaptive Spectral Wavelet Transform-based Self-Supervised Graph Neural Network
作者:劉茹悅,殷榮,劉勇,王偉平
論文概述:圖對比學習(GCL)結合了圖卷積網絡(GCN)和對比學習的優點,使其在學習節點表征方面大有可為。然而,這些方法中使用的 GCN 編碼器依賴于傅立葉變換來學習固定的圖表示,這在本質上受到不確定性原理的限制。為了克服現有方法不夠靈活且由于特征分解和稠密矩陣乘法帶來的昂貴計算成本的問題,本文提出了一種基于自適應譜小波變換的自監督圖神經網絡(ASWT-SGNN)。該方法采用頻譜自適應多項式來近似濾波函數,并利用對比損失來優化圖小波。這種設計可以在譜域和空間域創建局部濾波器,從而靈活地聚合各種尺度的鄰域信息,并促進局部信息和全局信息之間的可控轉換。與現有方法相比,所提出的方法降低了計算復雜度,并解決了圖卷積神經網絡受圖大小限制、缺乏對鄰域方面靈活控制的局限性。在八個基準數據集上進行的廣泛實驗表明,ASWT-SGNN 在高密度頻譜區域精確地近似了濾波函數,避免了代價高昂的特征分解。此外, ASWT-SGNN在節點分類任務中實現了與最先進的模型相當的性能。
論文介紹
論文題目:Would You Like Your Data to Be Trained? A User Controllable Recommendation Framework
作者:王磊,陳旭,董振華,戴全宇
通訊作者:陳旭
論文概述:傳統的推薦模型旨在收集廣泛的用戶信息以準確估計用戶偏好。然而,在實際場景中,用戶可能不希望所有行為都被納入模型訓練過程。本文介紹了一種新的推薦范式,允許用戶主動表明他們對使用個人數據用于模型訓練的“意愿”。我們將這個推薦場景建模為一個多人博弈,每個用戶作為一個參與者,模型通過平衡推薦質量和用戶意愿最大化整體效用。為了高效的尋找納什均衡,我們提出了一種基于影響函數的模型,用以近似不同決策下的推薦性能,而無需重新優化模型。此外,引入了一種利用多個錨點決策來提高影響函數近似準確性的方法。我們在模擬和真實世界數據集上進行了大量的實驗驗證了所提出模型在平衡推薦質量和用戶意愿方面的有效性,并對算法的收斂性給出了理論證明。
論文介紹
論文題目: Cost Minimization for Equilibrium Transition
作者:黃浩強,王子賀,魏智德,張捷
通訊作者:王子賀
論文概述:在本文中,我們深入探討了使用貨幣激勵來鼓勵玩家從初始的納什均衡轉移到更有利的均衡狀態這一問題。我們的主要焦點是計算促進這種均衡轉換所需的最小獎勵。游戲涉及一個擁有m種策略的行玩家和k個各擁有n種策略的列玩家。我們的發現表明,確定最小獎勵是否為零是NP-完全的,而計算最小獎勵變成了APX-難。盡管如此,我們還是帶來了一些積極的消息,即如果k或n是一個固定的常數,這個問題可以有效處理。此外,我們設計了一個具有加法誤差的近似算法,它在多項式時間內運行。最后,我們探討了一個特定情況,即效用函數表現出單峰特性,我們成功地證明了最優獎勵可以在多項式時間內計算出來。
論文介紹
論文題目:Prompting Segmentation with Sound is Generalizable Audio-Visual Source Localizer
作者:王耀霆,劉衛松,李光耀,丁健,胡迪,李璽
通訊作者:胡迪
論文概述:從未同時看到物體和聽到其對應聲音的情況下,模型是否仍然可以根據物體發出的聲音準確確定其視覺位置?在這項工作中,我們專注于在零樣本和少樣本的場景下研究視聽定位和分割任務。為了實現這一目標,與現有的采用編碼器-融合-解碼器(Encoder-Fusion-Decoder)范式從融合的視聽特征中解碼定位信息的主流方法不同,我們引入了編碼器-提示-解碼器(Encoder-Prompt-Decoder)范式,旨在借助來自預訓練模型的豐富先驗知識,更好地適應數據稀缺和數據分布多變等困境。具體而言,我們首先提出構建語義感知的音頻提示(Semantic-aware Audio Prompt),以幫助視覺基礎模型關注發聲物體,同時也通過對比學習縮小視覺和音頻模態之間的語義差距。我們還開發了一個相關性適配器(Correlation Adapter),以最小的訓練工作量對視覺基礎模型進行微調并盡可能地維持先驗知識。大量實驗表明,我們基于提示的范式在測試類別未知和跨數據集測試兩個設置中都優于其他基于融合的方法。我們希望我們的工作能夠進一步推動視聽定位和分割在實際應用場景中的泛化研究。
論文介紹
論文題目:SphereDiffusion: Spherical Geometry-aware Distortion Resilient Diffusion Model
作者:吳濤,勵雪巍,祁仲昂,胡迪,王鑫濤,單瀛,李璽
通訊作者:李璽,祁仲昂
論文概述:可控球面全景圖像生成在許多領域具有極大的應用價值。然而,由于球面全景圖像固有的球面畸變和幾何特性會導致現有方法生成的內容質量低下,這仍然是一項具有挑戰性的任務。在本文中,我們引入了一個新穎的SphereDiffusion框架來解決這些獨特的挑戰,從而更好地生成高質量且精確可控的球面全景圖像。對于球面畸變特性,我們將畸變對象的語義嵌入到文本編碼中,顯示地構建文本-畸變物品的對應關系,以更好地利用平面圖像的預訓練知識。同時,我們采用一種可變形技術來減輕球面畸變在隱空間中引起的語義偏差。對于球面幾何特性,我們利用球面全景圖像的旋轉不變性,在訓練過程中改進數據多樣性和優化目標,使模型能夠更好地學習球面幾何特性。此外,我們改進了擴散模型的去噪過程,使其能夠有效地利用學習到的幾何特性,確保生成圖像的邊界連續性。在Structured3D據集上的實驗顯示,我們的SphereDiffusion顯著提升了可控球面圖像生成的質量。
論文介紹
論文題目:Ada-Retrieval: An Adaptive Multi-Round Retrieval Paradigm for Sequential Recommendations
作者:李磊,練建勛,周驍,謝幸
通訊作者:周驍
論文概述:推薦系統的檢索階段旨在選擇與給定用戶偏好相匹配的物品候選集,在大規模推薦系統中扮演關鍵角色,因為隨后的排序模型高度依賴于物品候選集的質量。然而,大多數現有的檢索模型采用單輪推理的范式,無法充分捕捉用戶偏好的動態性且容易使得匹配的物品陷入一個固定區域。在本文中,我們提出了Ada-Retrieval,一種用于推薦系統的自適應多輪檢索范式,它迭代地優化用戶表示,以更好地捕捉全物品空間中的潛在候選集。Ada-Retrieval包括兩個關鍵模塊:物品表征調整器和用戶表征調整器,旨在將上下文信息注入到物品和用戶表征中。該框架是模型無關的方法,可以集成到多種基礎的序列化推薦模型(如RNN或Transformer)。我們以五個經典的序列化推薦模型作為基座,在三個公開數據集上進行實驗,結果表明,Ada-Retrieval顯著增強了經典的序列化推薦模型,并且優于其他基線方法。
論文介紹
論文題目:Causally Aware Generative Adversarial Networks for Light Pollution Control
作者:張宇堯,郭可,周驍
通訊作者:周驍
論文概述:當托馬斯·愛迪生的電燈第一次照亮紐約市的街道時,它標志著與人工照明交織在一起的現代照明時代的黎明到來。從那一刻起,我們生活在一個充滿人造光的世界。人造光在現代城市中發揮著不可或缺的作用,顯著提高了人類的生產力和文明效率。然而,過度照明會導致光污染,對經濟生活、生態系統和人類健康構成不可忽視的威脅。盡管其至關重要,但對其原因的探索在人工智能領域仍然相對有限,使人們對促成光污染的因素和可持續照明規劃的理解并不完全。為縮小這一差距,本文提出一種名為因果感知生成對抗網絡(CAGAN)的新框架。這一創新方法旨在揭示城市光污染的根本驅動因素,為城市可持續發展背景下的照明資源優化配置提供智能解決方案。我們首先調查了全球七個大都市的33,593個居民區的光污染水平。研究結果表明,不同的建筑類型對光污染水平有顯著的影響,尤其是草原、商業中心和居住建筑本身。這些因果關系被無縫地集成到生成模型框架中,指導生成不同居住區的光污染地圖的過程。大量的實驗展示了CAGAN在揭示和指導實施有效策略以減輕光污染方面的潛力。
論文介紹
論文題目:Tail-STEAK: Improve Friend Recommendation for Tail Users via Self-Training Enhanced Knowledge Distillation
作者:馬逸君,李朝卓,周驍
通訊作者:周驍
論文概述:圖神經網絡(GNN)近年來被廣泛用于朋友推薦系統。然而,最近的研究表明,與社交鏈接豐富的用戶(簡稱為頭部用戶)相比,只有有限社交鏈接的用戶(簡稱為尾部用戶)的性能有顯著的差距。統一對待頭部和尾部用戶將給尾部用戶偏好學習帶來兩個挑戰:(1)標簽稀疏性,即尾部用戶通常只有有限的標簽;和(2)鄰域稀疏性,即尾部用戶稀疏的可觀測社交鏈接導致其與頭部用戶有明顯的社交偏好分布差異,從而進一步導致性能下降。為了應對這些挑戰,我們提出了Tail-STEAK,一種用于尾部用戶表示學習的新型自訓練增強知識蒸餾框架。為了解決標簽稀疏問題,我們引入了一個稱為Tail-STEAK-base的兩階段自訓練框架,其中只有頭部用戶及其豐富的鏈接知識被用于第一階段的訓練,而在第二階段會為尾部用戶生成偽鏈接。為了解決鄰域稀疏問題,我們提出了兩個基于數據增強的自知識蒸餾輔助任務,使模型能夠同時理解頭部和尾部用戶偏好。這些任務被納入Tail STEAK-base的不同階段,形成完整的Tail STEAK框架。在最先進的基于GNN的朋友推薦模型上進行的大量實驗表明,Tail STEAK顯著提高了尾部用戶的性能。
論文介紹
論文題目:Simultaneous Optimization of Bid Shading and Internal Auction for Demand-Side Platforms
作者:Yadong Xu, Bonan Ni, Weiran Shen, Zichen Wang, Yinsong Xue, Pingzhong Tang
論文概述:在線廣告已成為互聯網平臺重要的增長來源之一,需求側平臺(DSP)在此系統中代表廣告主向廣告交易平臺出價。目前,越來越多的廣告交易平臺將其拍賣機制從第二價格拍賣轉向第一價格拍賣,需求側平臺在此不穩定環境中調整其出價策略是困難的。最近有關在第一價格拍賣中下調出價的研究可能因為關于獲勝概率分布的強假設而限制其表現。此外,這些研究并不考慮廣告主的激勵問題,而保證激勵是廣告平臺能可靠穩定的重要保證。在本文中,我們同時考慮降低出價和激勵兼容的內部拍賣機制。我們首先證明,該聯合設計能規約為一個為每個廣告主進行單調出價函數的選擇而不損失其最優性。然后我們提出使用一個參數化的神經網絡模型來實現該單調出價函數,在使用精心設計的替代函數后,我們的目標函數可以使用端到端的方式進行優化。最后,我們的實驗結果表明,我們的算法是有效的。