わかる医学論文
  • ホーム
新着論文 サイトマップ
2025.12.02 医療AI

喫煙歴抽出による肺がんスクリーニング改善

SmokeBERT: A Bidirectional Encoder Representations From Transformers-Based Model for Quantitative Smoking History Extraction From Clinical Narratives to Improve Lung Cancer Screening.

TOP > 医療AI > 記事詳細

🚬 喫煙歴抽出による肺がんスクリーニング改善

喫煙は肺がんをはじめとする多くの病気の主要なリスク要因です。喫煙歴の詳細な情報(例:喫煙パック年数や禁煙からの年数)は、病気のリスク評価や肺がんスクリーニングの適応を判断するために欠かせません。しかし、従来の自然言語処理(NLP)ツールは、臨床文書から詳細な喫煙データを抽出するのが難しいという課題があります。今回紹介する研究では、最新の技術を用いてこの問題を解決するための新しいモデル「SmokeBERT」が開発されました。

📊 研究概要

本研究の目的は、喫煙歴に関する詳細な定量データを抽出するための新しいNLPモデル「SmokeBERT」を開発することです。これにより、肺がんスクリーニングの精度を向上させることを目指しています。

🧪 方法

研究では、4つの事前学習済みBERTモデル(BERT、BioBERT、ClinicalBERT、MedBERT)を用いて、喫煙歴に関する3,261文から6つの定量的な喫煙歴変数を抽出しました。モデルの性能は、90%のデータを用いて交差検証を行い、最も高いF1スコアを示したClinicalBERTを最終モデルとして選定しました。

📈 主なポイント

評価指標 SmokeBERT 従来のNLPモデル
ホールドアウトテストF1スコア 0.97 0.88-0.90
外部検証F1スコア 0.86 0.72-0.79
肺がんスクリーニング適格患者の識別率(≥20パック年) 97% 59%-97%
肺がんスクリーニング適格患者の識別率(≤15年禁煙) 100% 60%-84%

🔍 考察

SmokeBERTは、喫煙歴の詳細な抽出において従来のモデルよりも優れた性能を示しました。特に、肺がんスクリーニングの適格患者を高精度で識別できる点が大きな利点です。この結果は、喫煙歴の詳細なデータが肺がんリスク評価において重要であることを示しています。また、今後はより大規模な臨床データセットでの性能評価や、多言語対応のSmokeBERTの開発が期待されています。

💡 実生活アドバイス

  • 定期的な健康診断を受け、喫煙歴を医師に正確に伝えましょう。
  • 禁煙を考えている方は、専門家のサポートを受けることをお勧めします。
  • 喫煙に関する情報を正確に把握することで、自分の健康リスクを理解しましょう。

⚠️ 限界/課題

本研究の限界として、使用したデータセットの規模や多様性が挙げられます。今後の研究では、より多くのデータを用いてモデルの性能を検証する必要があります。また、多言語対応のSmokeBERTを開発することで、さらに多くの患者に役立つ可能性があります。

まとめ

SmokeBERTは、喫煙歴の詳細な抽出を可能にする新しいNLPモデルであり、肺がんスクリーニングの精度向上に寄与することが期待されます。今後の研究により、さらなる改善が図られることを願っています。

🔗 関連リンク集

  • JCO Clinical Cancer Informatics
  • PubMed
  • アメリカ癌協会

参考文献

原題 SmokeBERT: A Bidirectional Encoder Representations From Transformers-Based Model for Quantitative Smoking History Extraction From Clinical Narratives to Improve Lung Cancer Screening.
掲載誌(年) JCO Clin Cancer Inform (2025 Dec)
DOI doi: 10.1200/CCI-25-00223
PubMed URL https://pubmed.ncbi.nlm.nih.gov/41325572/
PMID 41325572

書誌情報

DOI 10.1200/CCI-25-00223
PMID 41325572
PubMed URL https://pubmed.ncbi.nlm.nih.gov/41325572/
発行年 2025
著者名 Xue Yiming, Zhu Yunzheng, Zhuang Luoting, Oh YongKyung, Taira Ricky, Aberle Denise R, Prosper Ashley Elizabeth, Hsu William, Lin Yannan
著者所属 Department of Statistics and Data Science, University of California, Los Angeles, CA. / Medical and Imaging Informatics, Department of Radiological Sciences, David Geffen School of Medicine at UCLA, Los Angeles, CA.
雑誌名 JCO clinical cancer informatics

論文評価

評価データなし

関連論文

2026.01.19 医療AI

新しい人工知能ツールと既存の文献管理ソフトの比較

Comparison of reference management software with new artificial intelligence-based tools.

書誌情報

DOI 10.3352/jeehp.2026.23.2
PMID 41549369
PubMed URL https://pubmed.ncbi.nlm.nih.gov/41549369/
発行年 2026
著者名 Jin Jae Gyeong, Lee Seung Gyu, Park Jea Hyeun, Han Jang Won, Kim Jae Young, Seok Jungirl, Yoo Jeong-Ju
雑誌名 Journal of educational evaluation for health professions
2026.01.07 医療AI

原発癌の検出における細胞外DNA断片のサイズ選択

Detection of primary cancer types via fragment size selection in circulating cell-free extrachromosomal circular DNA.

書誌情報

DOI 10.1186/s13073-025-01595-6
PMID 41495807
PubMed URL https://pubmed.ncbi.nlm.nih.gov/41495807/
発行年 2026
著者名 Fang Jingwen, Luo Songwen, Li Shouzhen, Xu Yehong, Wang Jing, Shan Benjie, Hu Mingjun, Yu Qiaoni, Zhang Wen, Liu Ke, Shao Yunying, Yang Jiaxuan, Zhou YouYang, Xu Guangtao, Yao Xinfeng, Sun Ruoming, Zhang Mengyuan, Li Kun, Xu Xihai, Zhang Yongliang, Zhang Zhihong, Han Xinghua, Pan Yueyin, Guo Chuang, Qu Kun
雑誌名 Genome medicine
2026.01.02 医療AI

がん治療における機械学習とゲノミクス

Convergence of machine learning and genomics for precision oncology.

書誌情報

DOI 10.1038/s41568-025-00897-6
PMID 41478861
PubMed URL https://pubmed.ncbi.nlm.nih.gov/41478861/
発行年 2026
著者名 Reardon Brendan, Culhane Aedin C, Van Allen Eliezer M
雑誌名 Nature reviews. Cancer
  • がん・腫瘍学
  • メンタルヘルス
  • 免疫療法
  • 医療AI
  • 呼吸器疾患
  • 幹細胞・再生医療
  • 循環器・心臓病
  • 感染症全般
  • 携帯電話関連(スマートフォン)
  • 新型コロナウイルス感染症
  • 栄養・食事
  • 睡眠研究
  • 糖尿病
  • 肥満・代謝異常
  • 脳卒中・認知症・神経疾患
  • 腸内細菌
  • 運動・スポーツ医学
  • 遺伝子・ゲノム研究
  • 高齢医学

© わかる医学論文 All Rights Reserved.

TOPへ戻る