一区二区三区精女∨,视频列表-日韩

腦機(jī)接口與混合智能研究小組

更多動(dòng)態(tài)

283

2026-06-02

該論文發(fā)表于Association for the Advancement of Artificial Intelligence 2024（CCF-A 人工智能頂級(jí)會(huì)議），題目為《SleepFM: Multi-modal Representation Learning for Sleep across ECG, EEG and Respiratory Signals》。

斯坦福大學(xué)生物醫(yī)學(xué)數(shù)據(jù)科學(xué)系Rahul Thapa為第一作者和通訊作者。

論文鏈接：

https://openreview.net/forum?id=cDXtscWCKC

論文概要

睡眠是一個(gè)涉及多種生理信號(hào)的復(fù)雜過程，包括腦電圖（EEG）、心電圖（ECG）和呼吸信號(hào)等多種模態(tài)。現(xiàn)有的睡眠研究方法大多依賴有標(biāo)簽的單一任務(wù)數(shù)據(jù)，難以充分利用多導(dǎo)睡眠圖（PSG）中豐富的跨模態(tài)生理信息。此外，睡眠數(shù)據(jù)的標(biāo)注成本高昂，專家標(biāo)注耗時(shí)耗力，限制了大規(guī)模監(jiān)督學(xué)習(xí)方法的應(yīng)用。如何從海量的多模態(tài)睡眠數(shù)據(jù)中學(xué)習(xí)到有效的通用表征，是當(dāng)前睡眠醫(yī)學(xué)研究面臨的關(guān)鍵問題。

為了解決這些問題，本文提出了 SleepFM——首個(gè)基于多模態(tài)對(duì)比學(xué)習(xí)的睡眠基礎(chǔ)模型。SleepFM 利用來自超過 14,000 名參與者的多導(dǎo)睡眠圖數(shù)據(jù)（總計(jì)超過 100,000 小時(shí)），通過對(duì)比學(xué)習(xí)框架將 EEG、ECG 和呼吸信號(hào)三種模態(tài)的表征統(tǒng)一到共享的潛在空間中。本文提出了兩種對(duì)比學(xué)習(xí)策略：成對(duì)對(duì)比學(xué)習(xí)（Pairwise CL）和留一法對(duì)比學(xué)習(xí)（Leave-One-Out CL）。在下游任務(wù)評(píng)估中，基于 SleepFM 學(xué)習(xí)到的嵌入向量訓(xùn)練的邏輯回歸模型，在睡眠分期任務(wù)中達(dá)到宏平均 AUPRC 0.69，在呼吸暫停檢測(cè)中達(dá)到 AUPRC 0.71，顯著優(yōu)于端到端訓(xùn)練的 CNN 基線模型（睡眠分期 AUPRC 0.579，呼吸暫停檢測(cè) AUPRC 0.56）。該研究證實(shí)了多模態(tài)睡眠建模的價(jià)值，并展示了 SleepFM 在小樣本場(chǎng)景下的良好泛化能力。

研究背景

睡眠監(jiān)測(cè)對(duì)于理解睡眠障礙、評(píng)估大腦健康、肺部功能和心臟健康具有重要意義。多導(dǎo)睡眠圖（PSG）作為綜合性的夜間睡眠檢查手段，能夠記錄多種生理信號(hào)，包括腦電圖（EEG）、眼電圖（EOG）和心電圖（ECG）。傳統(tǒng)的 PSG 數(shù)據(jù)分析依賴于人工視覺檢查，這種方法勞動(dòng)密集且容易出錯(cuò)。近年來，監(jiān)督深度學(xué)習(xí)方法在自動(dòng)睡眠分期（尤其是呼吸暫停檢測(cè)）方面展現(xiàn)出了一定潛力。然而，大多數(shù)方法依賴于特定任務(wù)的標(biāo)注數(shù)據(jù)，很少利用 PSG 中多種模態(tài)所包含的完整生理動(dòng)態(tài)信息。

與此同時(shí)，對(duì)比學(xué)習(xí)作為一種強(qiáng)大的表征學(xué)習(xí)技術(shù)，在放射學(xué)和病理學(xué)等領(lǐng)域取得了顯著進(jìn)展。研究者通過將醫(yī)學(xué)影像與對(duì)應(yīng)的醫(yī)學(xué)報(bào)告配對(duì)進(jìn)行對(duì)比學(xué)習(xí)，學(xué)習(xí)到了豐富的醫(yī)學(xué)影像表征。然而，通過多模態(tài)對(duì)比學(xué)習(xí)將不同 PSG 通道配對(duì)來學(xué)習(xí)睡眠表征的研究仍然較少。雖然部分單模態(tài)對(duì)比學(xué)習(xí)方法已被應(yīng)用于 ECG 數(shù)據(jù)，但這些方法無法在潛在空間中有效比較不同模態(tài)的信號(hào)，而這對(duì)于遷移學(xué)習(xí)至關(guān)重要。因此，如何利用多模態(tài) PSG 數(shù)據(jù)通過對(duì)比學(xué)習(xí)構(gòu)建統(tǒng)一的睡眠基礎(chǔ)模型，是一個(gè)尚未被充分探索的研究方向。

研究方法

為了解決上述問題，本文提出了 SleepFM，一個(gè)通過多模態(tài)對(duì)比學(xué)習(xí)訓(xùn)練的睡眠基礎(chǔ)模型。SleepFM 的核心思想是將來自同一時(shí)間段的不同模態(tài)的生理信號(hào)（EEG、ECG 和呼吸信號(hào)）在潛在空間中拉近，同時(shí)將不同時(shí)間段的信號(hào)推遠(yuǎn)，從而學(xué)習(xí)到跨模態(tài)的統(tǒng)一表征。整體框架如圖 1 所示，主要包含數(shù)據(jù)預(yù)處理、嵌入模型設(shè)計(jì)和多模態(tài)對(duì)比學(xué)習(xí)三個(gè)關(guān)鍵部分。

Figure 1：多模態(tài) PSG 對(duì)比學(xué)習(xí)預(yù)訓(xùn)練框架概覽圖。內(nèi)容為：左側(cè)是原始睡眠數(shù)據(jù)（EEG/ECG/呼吸三種模態(tài)），分別通過各自的 CNN 編碼器生成嵌入向量；右側(cè)展示了成對(duì)對(duì)比學(xué)習(xí)（Pairwise）和留一法對(duì)比學(xué)習(xí)（Leave-One-Out）兩種訓(xùn)練方式的示意圖。

(1) 數(shù)據(jù)預(yù)處理

本文使用的數(shù)據(jù)來自美國(guó)一家睡眠診所自 1999 年起的 PSG 記錄，包含 14,068 條記錄，每條記錄涵蓋約 8 小時(shí)的睡眠數(shù)據(jù)。數(shù)據(jù)集根據(jù)三種主要模態(tài)（呼吸信號(hào)、EEG 和 ECG）進(jìn)行篩選，分別包含 7、10 和 2 個(gè)通道。所有總睡眠時(shí)長(zhǎng)被轉(zhuǎn)換為 30 秒的 epoch，數(shù)據(jù)重采樣至 256 Hz。標(biāo)注標(biāo)簽由專業(yè)睡眠技師標(biāo)注，包括：清醒（Wake）、Stage 1、Stage 2、Stage 3、REM 和睡眠呼吸暫停（Sleep Apnea）。為防止數(shù)據(jù)泄漏，數(shù)據(jù)集按照患者級(jí)別劃分為預(yù)訓(xùn)練集（11,261 名參與者）、訓(xùn)練集（1,265 名）、驗(yàn)證集（141 名）和測(cè)試集（1,401 名）。

(2) 嵌入模型

SleepFM 使用卷積神經(jīng)網(wǎng)絡(luò)（CNN）分別從呼吸、EEG 和 ECG 通道生成嵌入向量。針對(duì)三種不同的模態(tài)，分別設(shè)計(jì)了三個(gè)獨(dú)立的編碼器模型，主要差異在于輸入層的通道數(shù)不同（EEG 為 10 通道，ECG 為 2 通道，呼吸信號(hào)為 7 通道）。這些嵌入模型的架構(gòu)基于 MobileNetV2 和 EfficientNet 的輕量化設(shè)計(jì)，首先使用空洞卷積（atrous convolution）提取特征，隨后通過多通道一維卷積層處理。模型層數(shù)與 EfficientNet 的原始設(shè)計(jì)一致，但參數(shù)量大幅削減至原始架構(gòu)的不到 1/10，以優(yōu)化運(yùn)行效率和降低復(fù)雜度。在空洞卷積層之后，模型采用了殘差結(jié)構(gòu)，將輸入和輸出瓶頸層通過擴(kuò)展層相連接。

(3) 多模態(tài)對(duì)比學(xué)習(xí)

本文探索了兩種對(duì)比學(xué)習(xí)框架來學(xué)習(xí)跨模態(tài)的聯(lián)合表征：成對(duì)對(duì)比學(xué)習(xí)（Pairwise CL）和留一法對(duì)比學(xué)習(xí)（Leave-One-Out CL）。核心思想是將時(shí)間對(duì)齊的 30 秒片段中不同模態(tài)的正樣本嵌入在潛在空間中拉近，同時(shí)將負(fù)樣本推遠(yuǎn)。

在成對(duì)對(duì)比學(xué)習(xí)中，對(duì)所有模態(tài)對(duì)（EEG-ECG、EEG-呼吸、ECG-呼吸）構(gòu)建對(duì)比預(yù)測(cè)任務(wù)。對(duì)于來自模態(tài) i 的嵌入 x_i 和來自模態(tài) j 的嵌入 x_j，使用對(duì)比損失鼓勵(lì)正樣本對(duì)之間的一致性，同時(shí)抑制負(fù)樣本對(duì)之間的一致性。最終的損失函數(shù)為所有模態(tài)對(duì)的成對(duì)對(duì)比損失之和。

在留一法對(duì)比學(xué)習(xí)中，對(duì)于每個(gè)模態(tài) i，通過對(duì)其余模態(tài)的嵌入求平均來構(gòu)建一個(gè)"留一"表征 x_≠i，然后在模態(tài) i 的嵌入與該留一表征之間應(yīng)用對(duì)比損失。這種方法使得模型能夠從更全局的視角學(xué)習(xí)模態(tài)之間的關(guān)系。

實(shí)驗(yàn)結(jié)果

本文在多個(gè)任務(wù)上對(duì) SleepFM 進(jìn)行了全面評(píng)估，包括跨模態(tài)檢索、睡眠分期和呼吸暫停檢測(cè)，并與端到端訓(xùn)練的 CNN 基線模型進(jìn)行了對(duì)比。

(1) 跨模態(tài)檢索分析

檢索評(píng)估結(jié)果表明，SleepFM 的性能較基線指標(biāo)有顯著提升。模型在 Recall@10 指標(biāo)上實(shí)現(xiàn)了超過 500 至 7000 倍的提升（基線隨機(jī) Recall@10 = 0.0001）。在成對(duì)對(duì)比學(xué)習(xí)中，ECG 與 EEG 之間的檢索 Recall@10 達(dá)到 0.74-0.82，中位排名為 1-6；在留一法對(duì)比學(xué)習(xí)中，ECG 與 EEG 之間的 Recall@10 為 0.46-0.58。

成對(duì)對(duì)比學(xué)習(xí)在檢索任務(wù)上總體優(yōu)于留一法，這可能是因?yàn)闄z索評(píng)估直接映射了成對(duì)對(duì)比學(xué)習(xí)的訓(xùn)練方式。值得注意的是，呼吸信號(hào)與其他模態(tài)之間的檢索性能相對(duì)較低，這可能是因?yàn)?EEG 和 ECG 都捕捉身體內(nèi)的電信號(hào)活動(dòng)，具有更高的相似性和更易識(shí)別的模式。

(2) 睡眠分期分類

在睡眠分期這一多分類任務(wù)中（包含 Wake、Stage 1、Stage 2、Stage 3 和 REM 五個(gè)類別），基于 SleepFM 預(yù)訓(xùn)練表征訓(xùn)練的邏輯回歸模型在所有指標(biāo)上均優(yōu)于端到端訓(xùn)練的 CNN 基線模型。

留一法對(duì)比學(xué)習(xí)模型的宏平均 AUROC 達(dá)到 0.906，AUPRC 達(dá)到 0.685，顯著優(yōu)于成對(duì)對(duì)比學(xué)習(xí)模型（AUROC 0.876，AUPRC 0.608）和監(jiān)督 CNN 基線（AUROC 0.842，AUPRC 0.579）。具體到各類別，留一法模型在 REM 分類上的 AUROC 達(dá)到 0.951，在 Wake 分類上達(dá)到 0.945，在 Stage 2 分類上的 AUPRC 達(dá)到 0.876。

(3) 呼吸暫停檢測(cè)

在呼吸暫停檢測(cè)這一二分類任務(wù)中，留一法對(duì)比學(xué)習(xí)模型取得了最優(yōu)性能，AUROC 為 0.941，AUPRC 為 0.711，顯著優(yōu)于成對(duì)對(duì)比學(xué)習(xí)模型（AUROC 0.902，AUPRC 0.586）和監(jiān)督 CNN 基線（AUROC 0.843，AUPRC 0.555）?？紤]到呼吸暫停事件的低流行率（僅 1.7%），該模型在高不平衡數(shù)據(jù)上的表現(xiàn)尤為突出。

(4) 少樣本評(píng)估

本文在少樣本場(chǎng)景下（從 k=1 到完整訓(xùn)練集 1265 名參與者逐步增加訓(xùn)練數(shù)據(jù)量）對(duì)模型進(jìn)行了評(píng)估。結(jié)果如圖2顯示，在所有少樣本設(shè)置下，SleepFM 預(yù)訓(xùn)練模型均顯著優(yōu)于監(jiān)督 CNN 基線模型，在睡眠分期和呼吸暫停分類任務(wù)上均表現(xiàn)出色。留一法對(duì)比學(xué)習(xí)模型在所有樣本量下均顯著優(yōu)于成對(duì)對(duì)比學(xué)習(xí)模型，尤其在呼吸暫停分類任務(wù)中優(yōu)勢(shì)更為明顯。這一結(jié)果表明，SleepFM 在標(biāo)注數(shù)據(jù)有限的實(shí)際臨床場(chǎng)景中具有很好的應(yīng)用前景。

結(jié)論

本文提出了 SleepFM——首個(gè)基于多模態(tài)對(duì)比學(xué)習(xí)的睡眠基礎(chǔ)模型，通過整合 EEG、ECG 和呼吸信號(hào)三種生理模態(tài)，實(shí)現(xiàn)了對(duì)睡眠相關(guān)表征的統(tǒng)一建模。該方法的核心創(chuàng)新在于利用對(duì)比學(xué)習(xí)框架，將來自同一時(shí)間段的不同模態(tài)的生理信號(hào)在潛在空間中對(duì)齊，從而學(xué)習(xí)到具有跨模態(tài)一致性的高質(zhì)量表征。本文提出的兩種對(duì)比學(xué)習(xí)策略——成對(duì)對(duì)比學(xué)習(xí)和留一法對(duì)比學(xué)習(xí)——各有優(yōu)勢(shì)：成對(duì)對(duì)比學(xué)習(xí)在檢索任務(wù)上表現(xiàn)更優(yōu)，而留一法對(duì)比學(xué)習(xí)在所有下游分類任務(wù)中顯著優(yōu)于成對(duì)對(duì)比學(xué)習(xí)。

在來自超過 14,000 名參與者的多導(dǎo)睡眠圖數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明，SleepFM 在跨模態(tài)檢索、睡眠分期和呼吸暫停檢測(cè)等多個(gè)任務(wù)上均取得了優(yōu)異的性能?；?SleepFM 學(xué)習(xí)到的表征訓(xùn)練的邏輯回歸模型，在睡眠分期任務(wù)中宏平均 AUPRC 達(dá)到 0.69，在呼吸暫停檢測(cè)中 AUPRC 達(dá)到 0.71，均顯著優(yōu)于端到端訓(xùn)練的 CNN 基線模型。特別是在少樣本評(píng)估場(chǎng)景下，SleepFM 展現(xiàn)出了良好的泛化能力，證明了該方法在標(biāo)注數(shù)據(jù)有限的臨床環(huán)境中的實(shí)際應(yīng)用價(jià)值。該研究為睡眠醫(yī)學(xué)中的多模態(tài)生理信號(hào)分析提供了一種有效的基礎(chǔ)模型范式，為未來的睡眠研究和臨床應(yīng)用奠定了重要基礎(chǔ)。

撰稿人：方旭

審稿人：王斐

登錄用戶可以查看和發(fā)表評(píng)論，請(qǐng)前往登錄或注冊(cè)。

麻豆精品无码av,欧美1区2区,久久中文字幕乱码人妻,亚洲欧美另类少妇精品,在线看黄射,69pao高清,九九九久久久国产精品,子操大逼1234区,九九爱99热精品