麻豆精品无码av,欧美1区2区,久久中文字幕乱码人妻,亚洲欧美另类少妇精品,在线看黄射,69pao高清,九九九久久久国产精品,子操大逼1234区,九九爱99热精品

AAAI 2024 | SleepFM:跨心電圖、腦電圖和呼吸信號(hào)的睡眠多模態(tài)表示學(xué)習(xí)

該論文發(fā)表于Association for the Advancement of Artificial Intelligence 2024(CCF-A 人工智能頂級(jí)會(huì)議),題目為《SleepFM: Multi-modal Representation Learning for Sleep across ECG, EEG and Respiratory Signals》。

斯坦福大學(xué)生物醫(yī)學(xué)數(shù)據(jù)科學(xué)系Rahul Thapa為第一作者和通訊作者。

論文鏈接:

https://openreview.net/forum?id=cDXtscWCKC

論文概要

睡眠是一個(gè)涉及多種生理信號(hào)的復(fù)雜過程,包括腦電圖(EEG)、心電圖(ECG)和呼吸信號(hào)等多種模態(tài)。現(xiàn)有的睡眠研究方法大多依賴有標(biāo)簽的單一任務(wù)數(shù)據(jù),難以充分利用多導(dǎo)睡眠圖(PSG)中豐富的跨模態(tài)生理信息。此外,睡眠數(shù)據(jù)的標(biāo)注成本高昂,專家標(biāo)注耗時(shí)耗力,限制了大規(guī)模監(jiān)督學(xué)習(xí)方法的應(yīng)用。如何從海量的多模態(tài)睡眠數(shù)據(jù)中學(xué)習(xí)到有效的通用表征,是當(dāng)前睡眠醫(yī)學(xué)研究面臨的關(guān)鍵問題。

為了解決這些問題,本文提出了 SleepFM——首個(gè)基于多模態(tài)對(duì)比學(xué)習(xí)的睡眠基礎(chǔ)模型。SleepFM 利用來自超過 14,000 名參與者的多導(dǎo)睡眠圖數(shù)據(jù)(總計(jì)超過 100,000 小時(shí)),通過對(duì)比學(xué)習(xí)框架將 EEG、ECG 和呼吸信號(hào)三種模態(tài)的表征統(tǒng)一到共享的潛在空間中。本文提出了兩種對(duì)比學(xué)習(xí)策略:成對(duì)對(duì)比學(xué)習(xí)(Pairwise CL)和留一法對(duì)比學(xué)習(xí)(Leave-One-Out CL)。在下游任務(wù)評(píng)估中,基于 SleepFM 學(xué)習(xí)到的嵌入向量訓(xùn)練的邏輯回歸模型,在睡眠分期任務(wù)中達(dá)到宏平均 AUPRC 0.69,在呼吸暫停檢測(cè)中達(dá)到 AUPRC 0.71,顯著優(yōu)于端到端訓(xùn)練的 CNN 基線模型(睡眠分期 AUPRC 0.579,呼吸暫停檢測(cè) AUPRC 0.56)。該研究證實(shí)了多模態(tài)睡眠建模的價(jià)值,并展示了 SleepFM 在小樣本場(chǎng)景下的良好泛化能力。

研究背景

睡眠監(jiān)測(cè)對(duì)于理解睡眠障礙、評(píng)估大腦健康、肺部功能和心臟健康具有重要意義。多導(dǎo)睡眠圖(PSG)作為綜合性的夜間睡眠檢查手段,能夠記錄多種生理信號(hào),包括腦電圖(EEG)、眼電圖(EOG)和心電圖(ECG)。傳統(tǒng)的 PSG 數(shù)據(jù)分析依賴于人工視覺檢查,這種方法勞動(dòng)密集且容易出錯(cuò)。近年來,監(jiān)督深度學(xué)習(xí)方法在自動(dòng)睡眠分期(尤其是呼吸暫停檢測(cè))方面展現(xiàn)出了一定潛力。然而,大多數(shù)方法依賴于特定任務(wù)的標(biāo)注數(shù)據(jù),很少利用 PSG 中多種模態(tài)所包含的完整生理動(dòng)態(tài)信息。

與此同時(shí),對(duì)比學(xué)習(xí)作為一種強(qiáng)大的表征學(xué)習(xí)技術(shù),在放射學(xué)和病理學(xué)等領(lǐng)域取得了顯著進(jìn)展。研究者通過將醫(yī)學(xué)影像與對(duì)應(yīng)的醫(yī)學(xué)報(bào)告配對(duì)進(jìn)行對(duì)比學(xué)習(xí),學(xué)習(xí)到了豐富的醫(yī)學(xué)影像表征。然而,通過多模態(tài)對(duì)比學(xué)習(xí)將不同 PSG 通道配對(duì)來學(xué)習(xí)睡眠表征的研究仍然較少。雖然部分單模態(tài)對(duì)比學(xué)習(xí)方法已被應(yīng)用于 ECG 數(shù)據(jù),但這些方法無法在潛在空間中有效比較不同模態(tài)的信號(hào),而這對(duì)于遷移學(xué)習(xí)至關(guān)重要。因此,如何利用多模態(tài) PSG 數(shù)據(jù)通過對(duì)比學(xué)習(xí)構(gòu)建統(tǒng)一的睡眠基礎(chǔ)模型,是一個(gè)尚未被充分探索的研究方向。

研究方法

為了解決上述問題,本文提出了 SleepFM,一個(gè)通過多模態(tài)對(duì)比學(xué)習(xí)訓(xùn)練的睡眠基礎(chǔ)模型。SleepFM 的核心思想是將來自同一時(shí)間段的不同模態(tài)的生理信號(hào)(EEG、ECG 和呼吸信號(hào))在潛在空間中拉近,同時(shí)將不同時(shí)間段的信號(hào)推遠(yuǎn),從而學(xué)習(xí)到跨模態(tài)的統(tǒng)一表征。整體框架如圖 1 所示,主要包含數(shù)據(jù)預(yù)處理、嵌入模型設(shè)計(jì)和多模態(tài)對(duì)比學(xué)習(xí)三個(gè)關(guān)鍵部分。

Figure 1:多模態(tài) PSG 對(duì)比學(xué)習(xí)預(yù)訓(xùn)練框架概覽圖。內(nèi)容為:左側(cè)是原始睡眠數(shù)據(jù)(EEG/ECG/呼吸三種模態(tài)),分別通過各自的 CNN 編碼器生成嵌入向量;右側(cè)展示了成對(duì)對(duì)比學(xué)習(xí)(Pairwise)和留一法對(duì)比學(xué)習(xí)(Leave-One-Out)兩種訓(xùn)練方式的示意圖。

(1) 數(shù)據(jù)預(yù)處理

本文使用的數(shù)據(jù)來自美國(guó)一家睡眠診所自 1999 年起的 PSG 記錄,包含 14,068 條記錄,每條記錄涵蓋約 8 小時(shí)的睡眠數(shù)據(jù)。數(shù)據(jù)集根據(jù)三種主要模態(tài)(呼吸信號(hào)、EEG 和 ECG)進(jìn)行篩選,分別包含 7、10 和 2 個(gè)通道。所有總睡眠時(shí)長(zhǎng)被轉(zhuǎn)換為 30 秒的 epoch,數(shù)據(jù)重采樣至 256 Hz。標(biāo)注標(biāo)簽由專業(yè)睡眠技師標(biāo)注,包括:清醒(Wake)、Stage 1、Stage 2、Stage 3、REM 和睡眠呼吸暫停(Sleep Apnea)。為防止數(shù)據(jù)泄漏,數(shù)據(jù)集按照患者級(jí)別劃分為預(yù)訓(xùn)練集(11,261 名參與者)、訓(xùn)練集(1,265 名)、驗(yàn)證集(141 名)和測(cè)試集(1,401 名)。

(2) 嵌入模型

SleepFM 使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)分別從呼吸、EEG 和 ECG 通道生成嵌入向量。針對(duì)三種不同的模態(tài),分別設(shè)計(jì)了三個(gè)獨(dú)立的編碼器模型,主要差異在于輸入層的通道數(shù)不同(EEG 為 10 通道,ECG 為 2 通道,呼吸信號(hào)為 7 通道)。這些嵌入模型的架構(gòu)基于 MobileNetV2 和 EfficientNet 的輕量化設(shè)計(jì),首先使用空洞卷積(atrous convolution)提取特征,隨后通過多通道一維卷積層處理。模型層數(shù)與 EfficientNet 的原始設(shè)計(jì)一致,但參數(shù)量大幅削減至原始架構(gòu)的不到 1/10,以優(yōu)化運(yùn)行效率和降低復(fù)雜度。在空洞卷積層之后,模型采用了殘差結(jié)構(gòu),將輸入和輸出瓶頸層通過擴(kuò)展層相連接。

(3) 多模態(tài)對(duì)比學(xué)習(xí)

本文探索了兩種對(duì)比學(xué)習(xí)框架來學(xué)習(xí)跨模態(tài)的聯(lián)合表征:成對(duì)對(duì)比學(xué)習(xí)(Pairwise CL)和留一法對(duì)比學(xué)習(xí)(Leave-One-Out CL)。核心思想是將時(shí)間對(duì)齊的 30 秒片段中不同模態(tài)的正樣本嵌入在潛在空間中拉近,同時(shí)將負(fù)樣本推遠(yuǎn)。

在成對(duì)對(duì)比學(xué)習(xí)中,對(duì)所有模態(tài)對(duì)(EEG-ECG、EEG-呼吸、ECG-呼吸)構(gòu)建對(duì)比預(yù)測(cè)任務(wù)。對(duì)于來自模態(tài) i 的嵌入 x_i 和來自模態(tài) j 的嵌入 x_j,使用對(duì)比損失鼓勵(lì)正樣本對(duì)之間的一致性,同時(shí)抑制負(fù)樣本對(duì)之間的一致性。最終的損失函數(shù)為所有模態(tài)對(duì)的成對(duì)對(duì)比損失之和。

在留一法對(duì)比學(xué)習(xí)中,對(duì)于每個(gè)模態(tài) i,通過對(duì)其余模態(tài)的嵌入求平均來構(gòu)建一個(gè)"留一"表征 x_≠i,然后在模態(tài) i 的嵌入與該留一表征之間應(yīng)用對(duì)比損失。這種方法使得模型能夠從更全局的視角學(xué)習(xí)模態(tài)之間的關(guān)系。

實(shí)驗(yàn)結(jié)果

本文在多個(gè)任務(wù)上對(duì) SleepFM 進(jìn)行了全面評(píng)估,包括跨模態(tài)檢索、睡眠分期和呼吸暫停檢測(cè),并與端到端訓(xùn)練的 CNN 基線模型進(jìn)行了對(duì)比。

(1) 跨模態(tài)檢索分析

檢索評(píng)估結(jié)果表明,SleepFM 的性能較基線指標(biāo)有顯著提升。模型在 Recall@10 指標(biāo)上實(shí)現(xiàn)了超過 500 至 7000 倍的提升(基線隨機(jī) Recall@10 = 0.0001)。在成對(duì)對(duì)比學(xué)習(xí)中,ECG 與 EEG 之間的檢索 Recall@10 達(dá)到 0.74-0.82,中位排名為 1-6;在留一法對(duì)比學(xué)習(xí)中,ECG 與 EEG 之間的 Recall@10 為 0.46-0.58。

成對(duì)對(duì)比學(xué)習(xí)在檢索任務(wù)上總體優(yōu)于留一法,這可能是因?yàn)闄z索評(píng)估直接映射了成對(duì)對(duì)比學(xué)習(xí)的訓(xùn)練方式。值得注意的是,呼吸信號(hào)與其他模態(tài)之間的檢索性能相對(duì)較低,這可能是因?yàn)?EEG 和 ECG 都捕捉身體內(nèi)的電信號(hào)活動(dòng),具有更高的相似性和更易識(shí)別的模式。

(2) 睡眠分期分類

在睡眠分期這一多分類任務(wù)中(包含 Wake、Stage 1、Stage 2、Stage 3 和 REM 五個(gè)類別),基于 SleepFM 預(yù)訓(xùn)練表征訓(xùn)練的邏輯回歸模型在所有指標(biāo)上均優(yōu)于端到端訓(xùn)練的 CNN 基線模型。

留一法對(duì)比學(xué)習(xí)模型的宏平均 AUROC 達(dá)到 0.906,AUPRC 達(dá)到 0.685,顯著優(yōu)于成對(duì)對(duì)比學(xué)習(xí)模型(AUROC 0.876,AUPRC 0.608)和監(jiān)督 CNN 基線(AUROC 0.842,AUPRC 0.579)。具體到各類別,留一法模型在 REM 分類上的 AUROC 達(dá)到 0.951,在 Wake 分類上達(dá)到 0.945,在 Stage 2 分類上的 AUPRC 達(dá)到 0.876。

(3) 呼吸暫停檢測(cè)

在呼吸暫停檢測(cè)這一二分類任務(wù)中,留一法對(duì)比學(xué)習(xí)模型取得了最優(yōu)性能,AUROC 為 0.941,AUPRC 為 0.711,顯著優(yōu)于成對(duì)對(duì)比學(xué)習(xí)模型(AUROC 0.902,AUPRC 0.586)和監(jiān)督 CNN 基線(AUROC 0.843,AUPRC 0.555)??紤]到呼吸暫停事件的低流行率(僅 1.7%),該模型在高不平衡數(shù)據(jù)上的表現(xiàn)尤為突出。

(4) 少樣本評(píng)估

本文在少樣本場(chǎng)景下(從 k=1 到完整訓(xùn)練集 1265 名參與者逐步增加訓(xùn)練數(shù)據(jù)量)對(duì)模型進(jìn)行了評(píng)估。結(jié)果如圖2顯示,在所有少樣本設(shè)置下,SleepFM 預(yù)訓(xùn)練模型均顯著優(yōu)于監(jiān)督 CNN 基線模型,在睡眠分期和呼吸暫停分類任務(wù)上均表現(xiàn)出色。留一法對(duì)比學(xué)習(xí)模型在所有樣本量下均顯著優(yōu)于成對(duì)對(duì)比學(xué)習(xí)模型,尤其在呼吸暫停分類任務(wù)中優(yōu)勢(shì)更為明顯。這一結(jié)果表明,SleepFM 在標(biāo)注數(shù)據(jù)有限的實(shí)際臨床場(chǎng)景中具有很好的應(yīng)用前景。

結(jié)論

本文提出了 SleepFM——首個(gè)基于多模態(tài)對(duì)比學(xué)習(xí)的睡眠基礎(chǔ)模型,通過整合 EEG、ECG 和呼吸信號(hào)三種生理模態(tài),實(shí)現(xiàn)了對(duì)睡眠相關(guān)表征的統(tǒng)一建模。該方法的核心創(chuàng)新在于利用對(duì)比學(xué)習(xí)框架,將來自同一時(shí)間段的不同模態(tài)的生理信號(hào)在潛在空間中對(duì)齊,從而學(xué)習(xí)到具有跨模態(tài)一致性的高質(zhì)量表征。本文提出的兩種對(duì)比學(xué)習(xí)策略——成對(duì)對(duì)比學(xué)習(xí)和留一法對(duì)比學(xué)習(xí)——各有優(yōu)勢(shì):成對(duì)對(duì)比學(xué)習(xí)在檢索任務(wù)上表現(xiàn)更優(yōu),而留一法對(duì)比學(xué)習(xí)在所有下游分類任務(wù)中顯著優(yōu)于成對(duì)對(duì)比學(xué)習(xí)。

在來自超過 14,000 名參與者的多導(dǎo)睡眠圖數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,SleepFM 在跨模態(tài)檢索、睡眠分期和呼吸暫停檢測(cè)等多個(gè)任務(wù)上均取得了優(yōu)異的性能?;?SleepFM 學(xué)習(xí)到的表征訓(xùn)練的邏輯回歸模型,在睡眠分期任務(wù)中宏平均 AUPRC 達(dá)到 0.69,在呼吸暫停檢測(cè)中 AUPRC 達(dá)到 0.71,均顯著優(yōu)于端到端訓(xùn)練的 CNN 基線模型。特別是在少樣本評(píng)估場(chǎng)景下,SleepFM 展現(xiàn)出了良好的泛化能力,證明了該方法在標(biāo)注數(shù)據(jù)有限的臨床環(huán)境中的實(shí)際應(yīng)用價(jià)值。該研究為睡眠醫(yī)學(xué)中的多模態(tài)生理信號(hào)分析提供了一種有效的基礎(chǔ)模型范式,為未來的睡眠研究和臨床應(yīng)用奠定了重要基礎(chǔ)。

 

撰稿人:方旭

審稿人:王斐

 


登錄用戶可以查看和發(fā)表評(píng)論, 請(qǐng)前往  登錄 或  注冊(cè)。
SCHOLAT.com 學(xué)者網(wǎng)
免責(zé)聲明 | 關(guān)于我們 | 用戶反饋
聯(lián)系我們:
南岸区| 庐江县| 濉溪县| 台南县| 潼南县| 叙永县| 洮南市| 聂拉木县| 彰化市| 通许县| 阳城县| 平昌县| 海伦市| 东安县| 南涧| 泰和县| 盈江县| 嘉荫县| 荆州市| 怀柔区| 界首市| 双峰县| 普安县| 寻甸| 孙吴县| 肥城市| 冕宁县| 轮台县| 安图县| 汕尾市| 贵州省| 西昌市| 桐梓县| 凤冈县| 晋宁县| 湄潭县| 弥渡县| 定结县| 都江堰市| 江达县| 河池市|