麻豆精品无码av,欧美1区2区,久久中文字幕乱码人妻,亚洲欧美另类少妇精品,在线看黄射,69pao高清,九九九久久久国产精品,子操大逼1234区,九九爱99热精品

2
點贊
0
評論
0
轉(zhuǎn)載
我要入駐

AI4SS論文聚焦|CHI’26|反言論機器人賦能在線社區(qū)規(guī)范塑造:基于策略框架的旁觀者影響實證研究

收錄于合集: # 快訊

論文導讀

當你在評論區(qū)偶遇一句刺眼的惡言,手指懸在鍵盤上,最終卻還是劃走——怕孤軍奮戰(zhàn),怕惡意反撲,怕那句“關(guān)你什么事”。這一刻,你成為沉默的大多數(shù)。

基于大語言模型的反言論助手 Civilbot,則像一臺內(nèi)置策略引擎的辯手:它能識別仇恨言論的上下文,自動援引事實與邏輯,生成理性或感性的反駁。旁觀者只需按下一個“贊”——因為你看到了意見的代表,也看到了可以模仿的榜樣。它輸出的每一條回應,都是一份可復用的模板,讓猶豫的人終于敢寫下自己的第一句反駁,或者留下哪怕只是聲援與表態(tài)。

算法不止會筑起信息繭房,也能成為社群文明的錨點。只要有人率先開口,定下文明的基調(diào),沉默便不再是唯一答案。

近日,人機交互頂級學術(shù)會議 The ACM CHI conference on Human Factors in Computing Systems,CHI 2026(CCF A類會議)在西班牙巴塞羅那舉行。實驗室博士生王夢瑤作為第一作者,在會上報告論文“Echoes of Norms: Investigating Counterspeech Bots' Influence on Bystanders in Online Communities”。

反言論(counterspeech)為在線社區(qū)治理仇恨言論提供了一種非壓制性的替代路徑。既有研究主要關(guān)注反言論聊天機器人如何約束仇恨發(fā)言者、支持受害者,卻較少探討其對“旁觀者”的影響。然而,在多數(shù)網(wǎng)絡(luò)沖突場景中,真正占據(jù)數(shù)量優(yōu)勢、并潛在影響輿論走向的,往往正是這些未直接發(fā)聲的旁觀者。為此,我們構(gòu)建了一個系統(tǒng)化的反言論策略框架,并基于該框架開發(fā)了反言論機器人 Civilbot,通過混合方法的被試內(nèi)實驗設(shè)計,系統(tǒng)考察其對旁觀者認知與行為的影響。研究發(fā)現(xiàn),旁觀者普遍認為 Civilbot 具有較高的可信度與規(guī)范性,但其相對淺層的論證深度在一定程度上限制了說服效果。其行為影響呈現(xiàn)出微妙而情境化的特征:當表現(xiàn)良好時,機器人能夠引導旁觀者參與討論,甚至在一定程度上“代為發(fā)聲”;當表現(xiàn)欠佳時,則可能抑制旁觀者參與,或反向激發(fā)其主動介入。進一步分析表明,策略選擇至關(guān)重要。訴諸理性的認知型策略整體更為有效,尤其是在搭配積極語氣時效果更佳;而策略與語境的不匹配則可能削弱影響力?;谏鲜霭l(fā)現(xiàn),我們提出了一系列面向設(shè)計的啟示,旨在更有效地動員旁觀者、塑造在線討論的互動規(guī)范,強調(diào)在何時介入、如何通過以推理為核心、具備情境敏感性的策略實現(xiàn)更具建設(shè)性的公共對話。

本研究不僅拓展了對反言論機器人作用機制的理解,也為在線社區(qū)中“規(guī)范如何被看見、被回應、被再生產(chǎn)”這一問題提供了新的實證視角。通過關(guān)注旁觀者這一長期被忽視的關(guān)鍵群體,我們揭示了技術(shù)如何在不依賴壓制性手段的前提下,潛移默化地影響公共討論生態(tài),并為構(gòu)建更具包容性與理性表達空間的數(shù)字社區(qū)提供了理論與實踐基礎(chǔ)。

會議簡介

圖片

ACM CHI 2026 (The ACM Conference on Human Factors in Computing Systems)是國際公認的人機交互頂級學術(shù)會議,其在學術(shù)界和工業(yè)界享有極高聲譽,是中國計算機學會推薦的A類國際學術(shù)會議。與其它計算機科學會議相比,CHI規(guī)模龐大,更加注重人與技術(shù)之間的互動、探索創(chuàng)新的交互方式、新興技術(shù)在真實世界的應用、以及技術(shù)使用中的社會影響與倫理因素。今年CHI 2026會議錄用結(jié)果公布,本次會議共收到6730份完整投稿,最終錄用1703篇,錄用率為25.3%。

論文簡介

圖片

論文鏈接:https://arxiv.org/abs/2603.03687

在線社區(qū)旨在構(gòu)建開放、多元與理性討論的公共空間,但仇恨言論(hate speech)的擴散正在持續(xù)削弱這一理想。仇恨言論通常指針對特定群體、具有攻擊性與傷害性的表達形式,不僅會對個體造成情緒與心理層面的嚴重傷害,也會在群體層面強化刻板印象與社會偏見。更重要的是,它具有明顯的傳播與模仿效應:當用戶暴露于敵意表達時,即便本身并非高度攻擊性個體,也更可能產(chǎn)生類似言論,從而推動負面互動的擴散。這一過程本質(zhì)上影響的并不僅是單條內(nèi)容,而是社區(qū)規(guī)范(community norms)的形成機制。在線討論中的“什么可以說”“什么值得回應”“什么會被默認”并非天然存在,而是在互動中不斷被再生產(chǎn)。當仇恨言論頻繁出現(xiàn)且缺乏公開回應時,沉默可能被誤讀為容忍,進一步固化“多數(shù)人默認”的社會感知。傳統(tǒng)內(nèi)容審核(content moderation)主要依賴刪除、封禁或降權(quán)等限制性手段。然而,過度依賴壓制式干預可能帶來誤刪風險,也難以處理隱性或語境化的仇恨表達。在此背景下,反言論(counterspeech)逐漸被視為一種非壓制性(non-repressive)、以“以言對言”為核心的替代路徑。通過公開回應、理性論證、情感支持或價值重申,反言論不僅針對具體事件發(fā)聲,更通過可見的表達影響旁觀者認知,從而參與社區(qū)規(guī)范的塑造。

隨著生成式人工智能的發(fā)展,反言論聊天機器人(counterspeech chatbot)逐漸成為可能。已有研究圍繞語料構(gòu)建、生成模型訓練與策略增強展開,重點考察其如何約束仇恨發(fā)言者或支持受害者。然而,作為在線社區(qū)中人數(shù)最多、影響廣泛的群體,針對旁觀者(bystanders)的研究卻不足。旁觀者并非中立存在。他們通常傾向于反對仇恨言論,卻往往選擇沉默。沉默可能被解讀為默認,從而強化“多數(shù)人容忍仇恨”的感知,并加劇沉默螺旋(spiral of silence)。既有研究表明,人類發(fā)起的反言論能夠打破這種感知,甚至觸發(fā)從眾效應(herd effect),激發(fā)更多人發(fā)聲。然而,當反言論由機器人發(fā)出時,它是否能夠產(chǎn)生類似的社會影響?這種技術(shù)介入,是否同樣能夠改變旁觀者的認知與行為傾向?為此,本研究提出兩個核心研究問題:

  • RQ1:旁觀者在多大程度上認同聊天機器人的反言論,并在行為傾向上發(fā)生變化(例如,對論證強度的感知、對機器人的可信度評價,以及自身進行反言論的信心)?

  • RQ2:不同類型的聊天機器人反言論策略,如何影響旁觀者對回應的認同程度,以及其行為傾向的變化?

為系統(tǒng)研究反言論策略,我們構(gòu)建了一個三維策略框架,涵蓋句式形式(疑問/陳述)、語氣(積極/消極)與策略意圖(認知型與情感型),組合形成八種反言論策略。在此基礎(chǔ)上,我們開發(fā)了原型機器人 Civilbot,使其能夠在不同語境下生成對應策略的反言論回應。我們采用混合方法(mixed-method)的被試內(nèi)實驗設(shè)計(within-subject design),邀請對敏感議題感興趣、通常在公共討論中保持沉默、但明確反對仇恨言論的參與者加入研究。每位參與者在多個議題情境下閱讀仇恨言論與 Civilbot 的回應,并完成前后測量與半結(jié)構(gòu)化訪談。研究指標包括:反言論質(zhì)量感知(如論證強度與說服力)、主觀認同(如可信度與重要性評價),以及行為傾向(如反言論信心與參與意愿)。研究結(jié)果表明,Civilbot 的反言論能夠影響旁觀者對回應內(nèi)容與機器人的整體判斷,并對行為傾向產(chǎn)生細微但可觀察的影響。參與者普遍認為機器人具有可信度,并能夠傳遞社區(qū)規(guī)范信號;然而,其推理深度有限,在一定程度上制約了說服效果。行為層面呈現(xiàn)情境化特征:當表現(xiàn)良好時,機器人可以引導旁觀者參與,甚至在一定程度上“代為發(fā)聲”;當表現(xiàn)欠佳時,則可能抑制參與,或激發(fā)旁觀者主動介入。策略因素具有關(guān)鍵作用。整體而言,認知型策略相較情感型策略更具效果;語氣與句式的影響則依賴具體語境及其與策略的匹配程度?;谏鲜霭l(fā)現(xiàn),我們提出了面向設(shè)計的啟示:反言論機器人不僅需要判斷“是否介入”,還需要明確“為何介入”,并通過以推理為核心、信息支持充分、情境敏感的策略,更有效地參與社區(qū)規(guī)范的建構(gòu)。

反言論策略框架構(gòu)建

表1 反駁策略的框架

圖片

為了系統(tǒng)研究不同反言論策略對旁觀者的影響,我們首先構(gòu)建了一個結(jié)構(gòu)化的反言論策略框架,我們圍繞仇恨言論干預與反言論生成研究開展文獻梳理,在既有策略標簽基礎(chǔ)上,通過歸納式編碼(inductive coding)整合與重組策略類型,并以精細化可能性模型(Elaboration Likelihood Model, ELM)為理論基礎(chǔ),將策略區(qū)分為不同的影響路徑。最終框架由三個二元維度構(gòu)成:

  • 句式形式(Sentence Type)。區(qū)分疑問式與非疑問式表達。疑問式反言論(如反問)被視為一種獨立策略形式,其作用在于引發(fā)批判性思考或挑戰(zhàn)前提;其他表達形式(陳述、祈使等)則歸為非疑問式。

  • 語氣(Tone)。區(qū)分積極語氣與消極語氣。積極語氣強調(diào)禮貌、合作與同理心;消極語氣則更具批評性或?qū)剐?,可能包含諷刺或直接指責。為保證實驗可控性,我們采用二元劃分。

  • 策略意圖(Strategic Intent)。參考 ELM 理論,我們將策略意圖分為認知型策略(Cognitive Strategy)和情感型策略(Affective Strategy)。前者通過改變認知路徑產(chǎn)生影響,例如駁斥錯誤信息(rebutting falsehoods)或強調(diào)事實與證據(jù)(highlighting truth)。后者通過情緒喚起影響判斷,例如譴責仇恨發(fā)言者(denouncing hate speakers)或支持受害群體(supporting targets of hate)。

最終構(gòu)成一個 2 × 2 × 2 共八種不同反言論策略,為后續(xù)實驗中的刺激材料提供清晰可控的操作基礎(chǔ)。

 

實驗設(shè)計:從真實語料到可控情境

  • 反仇恨語料構(gòu)建。我們基于來自知乎(Zhihu)的中文偏見語料庫 CDIAL-BIAS DATASET篩選仇恨言論樣本,最終保留涵蓋性別、種族、地域與職業(yè)四類議題的27條代表性仇恨言論。隨后,基于前述三維反言論策略框架,利用 GPT-5 生成嚴格對應八種策略組合的回應文本,并通過雙人標注驗證其在“句式、語氣、策略意圖”三個維度上的一致性,確保實驗材料的可控性與策略純度。

  • 模擬平臺與界面設(shè)計。為增強生態(tài)效度,我們構(gòu)建了一個仿知乎結(jié)構(gòu)的模擬討論平臺,復現(xiàn)問答瀏覽體驗。為避免額外線索干擾,我們移除了點贊、評論排序等社會信號,僅保留問題、若干中性回答、仇恨言論及 Civilbot 的反言論回應。Civilbot被明確標注為平臺官方賬號,以避免人格化或性別化聯(lián)想。所有視覺元素與呈現(xiàn)順序均經(jīng)過控制,以隔離反言論策略本身的影響。

圖片

圖1 模擬討論平臺的示例頁面

  • 參與者招募與篩選。我們通過便利抽樣與滾雪球抽樣方式,在微信平臺招募參與者。研究重點為“潛在旁觀者”:活躍于網(wǎng)絡(luò)社區(qū)、關(guān)注敏感議題、反對仇恨言論,但通常保持沉默的用戶。樣本量基于 G*Power 功效分析確定,滿足重復測量設(shè)計所需統(tǒng)計功效,最終納入52名有效參與者。研究通過倫理審批。

  • 實驗流程。實驗采用被試內(nèi)設(shè)計(within-subject design),每位參與者在八個不同議題情境中分別體驗八種反言論策略。參與者首先瀏覽仇恨言論并完成前測評價,隨后閱讀 Civilbot 的回應,再完成后測。議題順序與策略分配均隨機化,以避免固定搭配造成偏差。實驗結(jié)束后進行半結(jié)構(gòu)化訪談,深入了解參與者對機器人角色、策略效果及社區(qū)規(guī)范影響的主觀理解。

圖片

圖2 實驗流程

  • 測量指標。我們圍繞反言論質(zhì)量感知(如論證強度與說服力)、主觀認同程度(如可信度與重要性)、行為傾向變化(如反言論信心與參與意愿)三個核心維度進行測量。

  • 數(shù)據(jù)分析。本研究采用混合方法(mixed-methods approach)。在定量分析方面,我們通過單因素與雙因素方差分析(ANOVA)檢驗“策略意圖、語氣、句式形式”三個維度的主效應與交互效應,并結(jié)合探索性比較分析不同策略組合之間的差異。在定性分析方面,我們對訪談與開放式反饋進行主題分析(thematic analysis),歸納參與者對 Civilbot 可信度、情境適配性與規(guī)范影響的理解,從而補充量化結(jié)果。

實驗結(jié)果

圖片

圖3 RQ1、RQ2結(jié)果與設(shè)計啟示總覽

1. RQ1:反言論機器人對旁觀者的整體影響

結(jié)果顯示,Civilbot 的影響是復雜而有限的,但具有穩(wěn)定的規(guī)范價值。在態(tài)度層面,參與者普遍將 Civilbot 視為一種“合法的規(guī)范性聲音”。它強化了“仇恨言論不可接受”的社區(qū)共識,也為長期沉默的用戶提供了心理支持。然而,其說服力受到表達方式的限制。部分參與者認為回應論證較淺、表達偏模板化,顯得“過于AI”,從而削弱了認知上的穿透力。在行為層面,其影響呈現(xiàn)分化。一方面,它提升了部分用戶的反言論信心;另一方面,也可能替代沉默旁觀者發(fā)聲,使他們繼續(xù)保持沉默。更有趣的是,當回應被認為不夠有力時,反而激發(fā)了部分參與者的糾正沖動。也就是說,Civilbot 既可能引導參與,也可能成為負面示范或逆向激勵。它的價值不在于動員所有人發(fā)聲,而在于持續(xù)提供一個穩(wěn)定的“反聲部”,為旁觀者提供安全定位。在社區(qū)層面,Civilbot 主要發(fā)揮調(diào)節(jié)功能:補充信息以幫助識別仇恨與錯誤認知,冷卻情緒避免沖突升級,并引發(fā)進一步思考。它更像一個“平衡器”而非辯論者,通過維持知識與情緒的穩(wěn)定,鞏固社區(qū)規(guī)范。總體而言,Civilbot 能強化規(guī)范與穩(wěn)定社區(qū)氣候,但其說服與動員能力仍受表達質(zhì)量與情境適配性的限制。

2. RQ2:不同反言論策略的差異化影響

表2 反駁策略在三種指標上的主效應

圖片

表3 反駁策略在三種指標上的交互效應

圖片

表4 反駁策略在三種指標上的簡單效應分析

圖片
  • 策略意圖(Strategic Intent)的影響最為顯著。認知型策略整體優(yōu)于情感型策略,在感知質(zhì)量、可信度與認同度上表現(xiàn)更好。以事實澄清、邏輯反駁為核心的回應更容易獲得旁觀者認可。但情感策略并非無效。參與者指出,在情緒對立較強的場景下,情感性表達可以作為鋪墊,緩沖緊張氛圍,為后續(xù)認知論證創(chuàng)造空間。因此,兩類策略并非對立,而更適合情境化組合。

  • 語氣(Tone)主要影響行為傾向。積極語氣顯著提升參與信心與發(fā)聲意愿,使旁觀者更愿意介入討論。消極語氣則需要謹慎控制。參與者更認可帶有幽默或諷刺意味的“善意冒犯”,而非直接攻擊。過強的負面表達容易削弱說服效果,甚至掩蓋策略本身的意圖。

  • 句式形式(Sentence Type)具有雙刃劍特征。疑問式表達整體呈顯著影響,但效果取決于設(shè)計方式。真誠的問題可以引導反思與信息補充;而反問或質(zhì)問式表達則可能被解讀為挑釁,從而降低可信度。因此,問題最有效的功能不是對抗,而是引導思考與延續(xù)對話。

  • 交互效應。語氣放大或削弱策略意圖。積極語氣會顯著放大認知型策略的效果;情感型策略在積極語氣下反而可能顯得表層化;在消極語氣下,強烈情緒表達容易掩蓋策略差異。這意味著,語氣不僅是表達風格,更是影響策略可見度與可接受度的關(guān)鍵變量。對 Civilbot 而言,優(yōu)先采用積極語氣來承載認知型內(nèi)容,是更穩(wěn)健的組合方式。

  • 探索性發(fā)現(xiàn)。探索性分析進一步發(fā)現(xiàn),參與者在自我生成反言論時更傾向使用負向語氣,但卻期待 AI 保持克制與規(guī)范。這揭示出一種潛在的人機角色分工:人類可以承擔情緒表達與對抗功能,而 AI 更適合作為理性支撐與規(guī)范維護者。

設(shè)計啟示:
何時介入,如何介入,以及誰在介入

  • 何時介入:針對仇恨的程度,在注意力與沖突風險之間取得平衡;

  • 如何介入:動機識別 → 推理分析 → 信息支持 → 論點構(gòu)建 → 策略選擇 → 風格調(diào)節(jié);

  • 誰在介入:反言論的效果并不只取決于策略本身,還取決于“說話者是誰”,需要區(qū)分兩種設(shè)計路徑,一個是自主型反言論機器人,強調(diào)規(guī)范維護、客觀表達與社區(qū)角色定位;AI輔助型反言論系統(tǒng),保留人類發(fā)聲主體,強調(diào)協(xié)作與賦能。

小結(jié)

反言論機器人提供了一種非壓制、以社區(qū)為本的干預方式,它并非替代人類參與,也非單純對抗仇恨,而是在關(guān)鍵時刻、以恰當方式和身份發(fā)聲,穩(wěn)定在線社區(qū)規(guī)范、支持旁觀者,并為建設(shè)性對話保留空間。實驗顯示,策略選擇和語氣適配至關(guān)重要:認知型策略為核心,情感和問題形式可靈活組合,以應對不同情境和社區(qū)文化。更廣泛地看,這類技術(shù)不僅可幫助管理仇恨言論,更有潛力塑造健康、理性、可持續(xù)的公共討論環(huán)境,為數(shù)字社會的信任和共識建設(shè)提供新見解。

 

如果您對本文內(nèi)容感興趣,可與通訊作者聯(lián)系: zhangpeng_@fudan.edu.cn

 

實驗室相關(guān)論文

[1] Wenxin Zhao, Fangyu Yu, Peng Zhang, Hansu Gu, Lin Wang, Siyuan Qiao, Tun Lu, and Ning Gu. 2025. YouthCare: Building a Personalized Collaborative Video Censorship Tool to Support Parent-Child Joint Media Engagement. In Proceedings of the 2025 CHI Conference on Human Factors in Computing Systems (CHI '25). Association for Computing Machinery, New York, NY, USA, Article 1042, 1–20.

[2] Yaqiong Li, Peng Zhang, Hansu Gu, Tun Lu, Siyuan Qiao, Yubo Shu, Yiyang Shao, and Ning Gu. 2025. DeMod: A Holistic Tool with Explainable Detection and Personalized Modification for Toxicity Censorship. Proc. ACM Hum.-Comput. Interact. 9, 2, Article CSCW061 (May 2025), 24 pages. 

 

如果您對我們實驗室的相關(guān)工作感興趣,歡迎訪問我們的網(wǎng)站:

協(xié)同信息與系統(tǒng)實驗室(CISL)

實驗室網(wǎng)站主頁https://cscw.fudan.edu.cn/

實驗室Github主頁https://github.com/FudanCISL

學者網(wǎng)機構(gòu)號是學者網(wǎng)提供的學術(shù)"公眾號"平臺,為學者團隊、學術(shù)機構(gòu)、企業(yè)等提供官方媒體賬號服務,支持發(fā)布動態(tài)、活動、通知與招生招聘信息等內(nèi)容,支持多人協(xié)作維護,助力機構(gòu)鏈接學界資源、擴大學術(shù)影響力。

返回頂部
铅山县| 琼结县| 景德镇市| 广丰县| 石河子市| 许昌县| 延长县| 玉树县| 新化县| 宁晋县| 武夷山市| 于田县| 西青区| 雅江县| 基隆市| 唐山市| 禹州市| 建始县| 榆中县| 昌江| 孟连| 巍山| 泽普县| 莆田市| 定安县| 禄劝| 麻江县| 宁强县| 安顺市| 兖州市| 即墨市| 福贡县| 隆回县| 菏泽市| 溆浦县| 西林县| 弋阳县| 辽宁省| 赤峰市| 仪陇县| 莱芜市|