中國西藏網 > 即時新聞 > 國內

中科院團隊發布國際最大規模漢語同步多模態神經影像數據集

發布時間:2022-10-10 11:19:00來源: 中國新聞網

  中新網北京10月9日電 (記者 孫自法)中國科學院自動化研究所(中科院自動化所)9日向媒體發布信息說,該所自然語言處理研究組歷時近兩年,采集處理完成迄今國際上規模最大、包含信息最豐富的漢語同步多模態神經影像數據集,并于近日正式對外發布。

  該數據集覆蓋了近萬個漢語詞匯,是當前國際上最大規模的用于腦語言處理機制研究的多模態同步神經影像數據集。其相關研究成果論文已在《自然》(Nature)旗下專業學術期刊《科學數據》(Scientific Data)發表。

  據中科院自動化所自然語言處理研究組介紹,大腦在加工語言時,需要實時調動多個腦區的神經元進行協同工作。構建高時空分辨率的神經影像數據可以幫助人們更好地了解各個腦區以及腦區之間的協同合作,對于研究大腦的語言加工機制至關重要。

  當前已有的開源數據主要針對英文采集,只包括單一模態的神經影像數據,如高空間分辨率的功能核磁共振(fMRI)或高時間分辨率的腦磁圖(MEG),并且大多使用1小時以內的實驗材料,數據規模有限,無法借助數據需求量大的計算模型進行更全面、更深入的大腦語言加工機制探索。

  為突破上述問題,該研究組歷時近兩年采集處理完成目前國際上規模最大、包含信息最豐富的漢語同步多模態神經影像數據集,針對12個被試收聽約6個小時故事時的功能核磁共振(fMRI)、腦磁圖(MEG)、每個被試的T1/T2加權結構像、擴散磁共振成像(diffusion MRI)和靜息態核磁共振(resting MRI)數據采集整理而成。為了便于利用計算模型進行腦語言處理機制的研究,所有故事材料都由人工標注了句法結構樹,計算了文本中每個詞匯對應的音頻時間點、詞頻以及多種不同字和詞匯的向量。同時,所有測試指標均超越或可比于已有的同類數據集,具有充分的質量保證。

  中科院自動化所自然語言處理研究組表示,目前國際最大規模漢語同步多模態神經影像數據集的公開發布,可以為全方位研究大腦在真實場景下理解詞匯、短語和句子時如何調動不同腦區以及不同腦區之間如何協同工作等科學問題提供重要支撐。

  特別值得注意的是,該數據集覆蓋了近萬個漢語詞匯,這不僅對于研究大腦理解漢語的認知機理具有重要意義,而且將在探索自然語言計算模型與人腦語言處理機制之間的關系,研究如何利用神經影像數據提升現有語言計算模型的性能,從而構建新一代受腦啟發的神經語言模型等一系列工作中發揮顯著作用。(完)

(責編:陳濛濛)

版權聲明:凡注明“來源:中國西藏網”或“中國西藏網文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網和署著作者名,否則將追究相關法律責任。

在线播放中文字幕| 亚洲AV中文无码乱人伦下载 | 97久久精品无码一区二区| 欧美中文在线视频| 国产精品午夜福利在线无码| 久久午夜夜伦鲁鲁片免费无码影视| 久久久久亚洲?V成人无码| 亚洲AV无码精品无码麻豆| 最近完整中文字幕2019电影| 亚洲人成无码网WWW| 色窝窝无码一区二区三区成人网站 | 天堂最新版中文网| 亚洲äv永久无码精品天堂久久| 老子午夜精品无码| 亚洲日韩在线中文字幕综合 | 人妻少妇精品视中文字幕国语| 东京热加勒比无码少妇| 在线观看片免费人成视频无码| 色综合中文字幕| 成人精品一区二区三区中文字幕 | 成?∨人片在线观看无码| 亚洲AV无码精品色午夜果冻不卡 | 精品国产aⅴ无码一区二区| 亚洲日本中文字幕| 国产日韩精品中文字无码| 狠狠躁天天躁中文字幕无码| 亚洲午夜福利精品无码| 国精无码欧精品亚洲一区| 久久久无码精品亚洲日韩按摩| 亚洲国产AV无码专区亚洲AV| 国产丝袜无码一区二区三区视频 | 精品无码一区二区三区在线| 免费精品久久久久久中文字幕| 色综合久久中文综合网| 亚洲精品人成无码中文毛片| 国产高清中文欧美| 亚洲国产中文字幕在线观看| 中文字幕精品一区| 最新高清无码专区| 十八禁无码免费网站| 国产在线无码一区二区三区视频|