<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          AIWIN 心電圖智能診斷Baseline【線上0.719】

          共 1836字,需瀏覽 4分鐘

           ·

          2021-11-19 18:12

          今天老肥和大家分享的是AIWIN的秋季賽-心電圖智能診斷競賽的任務(wù)一Baseline方案,線上與線下驗證得分均為0.719,采用的是單模樹模型。

          賽題背景

          心電圖是臨床最基礎(chǔ)的一個檢查項目,因為安全、便捷成為心臟病診斷的利器。每天都有大量的心電圖診斷需求,但是全國范圍內(nèi)診斷心電圖的專業(yè)醫(yī)生數(shù)量不足,導致很多醫(yī)院都面臨專業(yè)心電圖醫(yī)生短缺的情況。

          人工智能技術(shù)的出現(xiàn),為改善醫(yī)生人力資源不足的問題帶來了全新的可能。由于心電圖數(shù)據(jù)與診斷的標準化程度較高,相對較易于運用人工智能技術(shù)進行智能診斷算法的開發(fā)。

          賽題任務(wù)與數(shù)據(jù)

          本賽題任務(wù)一為要求針對心電圖輸出二元(正常 v.s 異常)分類標簽,評價指標為F1,心電數(shù)據(jù)的單位為mV,采樣率為 500HZ,記錄時長為 10 秒,存儲格式為 MAT;文件中存儲了 12 導聯(lián)的電壓信號(包含了I,II,III,aVR,aVL,aVF,V1,V2,V3,V4,V5 和 V6)。

          Baseline方案

          每個樣本心電圖的數(shù)據(jù)的形狀為(12,5000), 一個非常直觀的思路便是將其進行分導聯(lián)采樣再將所有導聯(lián)展平作為訓練的原始數(shù)據(jù)避免特征維度過大。

          def?get_data(sep_length):
          ????"""
          ????讀取數(shù)據(jù),提取部分數(shù)據(jù)用于訓練預(yù)測
          ????"
          ""

          ????train_path?=?glob.glob('data/train/*.mat')
          ????test_path?=?glob.glob('data/val/*.mat')

          ????matrix?=?np.zeros((2000,?5000?*?12?//?sep_length))

          ????i?=?0
          ????for?p?in?tqdm(train_path):
          ????????ecgdata?=?sio.loadmat(p)['ecgdata']
          ????????sep?=?ecgdata[:,?::sep_length]
          ????????sep?=?sep.reshape(-1,)
          ????????matrix[i,?:]?=?sep
          ????????i?+=?1
          ????for?p?in?tqdm(test_path):
          ????????ecgdata?=?sio.loadmat(p)['ecgdata']
          ????????sep?=?ecgdata[:,?::sep_length]
          ????????sep?=?sep.reshape(-1,)
          ????????matrix[i,?:]?=?sep
          ????????i?+=?1??

          ????data?=?pd.DataFrame(matrix)
          ????data.columns?=?[f'{i}'?for?i?in?range(len(data.columns))]
          ????return?data

          對于該數(shù)據(jù)進行特征提取,主要包括不同導聯(lián)內(nèi)數(shù)據(jù)的均值、方差等統(tǒng)計,所有導聯(lián)數(shù)據(jù)的均值、方差等統(tǒng)計,因為該數(shù)據(jù)為時序,考慮對數(shù)據(jù)做差分再求統(tǒng)計。

          def?feature_eng(data,?f,?feat):
          ????"""
          ????統(tǒng)計特征
          ????"
          ""
          ????data[f'{f}_min']?=?data[feat].min(1)
          ????data[f'{f}_max']?=?data[feat].max(1)
          ????data[f'{f}_mean']?=?data[feat].mean(1)
          ????data[f'{f}_std']?=?data[feat].std(1)
          ????data[f'{f}_median']?=?data[feat].median(1)
          ????data[f'{f}_skew']?=?data[feat].skew(1)????
          ????return?data

          特征提取完后我們直接使用競賽利器LightGBM進行五折交叉驗證訓練預(yù)測并生成提交文件即可。

          除了上述內(nèi)容,我們可以進一步對數(shù)據(jù)的時序特性進行挖掘,也可以嘗試使用深度學習模型對本賽題任務(wù)進行建模。最后,按照慣例我已上傳了完整Baseline代碼,在后臺回復(fù)「ECG」即可,祝大家比賽順利,獎金多多!


          END



          瀏覽 68
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  中文字幕嫩性淫 | 欧美一级日韩一级 | 国产又黄又大又粗的视频 | 黄黄片在线看 | 俺也去视频|