ChatGPTとDeepSeekによる中国語の聴覚士資格試験の比較：観察研究

🧠 ChatGPTとDeepSeekによる中国語の聴覚士資格試験の比較

近年、生成的人工知能（GenAI）の進化が著しく、医療や教育などの分野での応用が広がっています。特に、ChatGPTやDeepSeekといったAIモデルは、様々なタスクにおいて人間の能力を補完する可能性を秘めています。本記事では、これらのAIモデルが中国語の聴覚士資格試験においてどのようなパフォーマンスを示したのかを解説します。

📊 研究概要

本研究は、2024年の台湾聴覚士資格試験におけるChatGPT（GPT-4-turbo）とDeepSeek（DeepSeek-R1）のパフォーマンスを評価することを目的としています。試験は300の選択問題から構成され、基本的な聴覚科学、行動聴覚学、電気生理学的聴覚学、補聴器の原則と実践、聴覚および平衡システムの健康とリハビリテーション、聴覚と言語コミュニケーション障害（専門倫理を含む）という6つの科目に分かれています。

🔍 方法

研究では、両モデルの回答過程と推論経路を記録し、全体的な正確性、科目別スコア、問題タイプ別スコアを分析しました。項目レベルでの統計的比較はMcNemar検定を用いて行われました。

📈 主なポイント

モデル	全体の正確性	基本聴覚科学	行動聴覚学	電気生理学的聴覚学	補聴器の原則と実践	聴覚と平衡システムの健康	聴覚と言語コミュニケーション障害
ChatGPT	80.3% (241/300)	88% (44/50)	70% (35/50)	86% (43/50)	76% (38/50)	82% (41/50)	80% (40/50)
DeepSeek	79.3% (238/300)	82% (41/50)	72% (36/50)	78% (39/50)	80% (40/50)	80% (40/50)	84% (41/50)

🧐 考察

研究の結果、ChatGPTとDeepSeekは、台湾聴覚士資格試験の合格基準である60%を上回る正確性を示しました。特に、ChatGPTは基本聴覚科学で88%の正確性を記録し、DeepSeekは聴覚と言語コミュニケーション障害で84%を達成しました。しかし、行動聴覚学においては両モデルともに低いスコアを示しました。

また、問題タイプ別の分析では、逆論理問題に対しては両モデルともに高いパフォーマンスを示しましたが、グラフベースの問題に対しては低い正確性を示しました。これらの結果は、AIモデルが特定の問題形式に対して強い一方で、他の形式では課題があることを示しています。

💡 実生活アドバイス

AIを教育ツールとして利用する際は、教師の監督のもとで使用することが重要です。
AIの回答が必ずしも正確であるとは限らないため、他の信頼できる情報源と照らし合わせることが推奨されます。
今後の研究では、実際の臨床シナリオにおけるAIのパフォーマンスを評価することが必要です。

🔍 限界/課題

本研究にはいくつかの限界があります。まず、使用したAIモデルのバージョンや設定が結果に影響を与える可能性があります。また、試験の内容が特定の地域や文化に依存しているため、他の地域での適用性には注意が必要です。さらに、AIの使用における倫理的な側面や、誤情報のリスクについても考慮する必要があります。

まとめ

ChatGPTとDeepSeekは、聴覚士資格試験において高い正確性を示し、教育や臨床トレーニングにおける支援ツールとしての可能性を示唆しています。しかし、誤りの存在は慎重な使用が求められることを示しています。

🔗 関連リンク集

参考文献

原題	Comparison of ChatGPT and DeepSeek on a Standardized Audiologist Qualification Examination in Chinese: Observational Study.
掲載誌(年)	JMIR Form Res (2025 Nov 28)
DOI	doi: 10.2196/79534
PubMed URL	https://pubmed.ncbi.nlm.nih.gov/41313805/
PMID	41313805

書誌情報

DOI	10.2196/79534
PMID	41313805
PubMed URL	https://pubmed.ncbi.nlm.nih.gov/41313805/
発行年	2025
著者名	Qi Beier, Zheng Yan, Wang Yuanyuan, Xu Li
著者所属	Beijing Tongren Hospital, Capital Medical University, Key Laboratory of Otolaryngology - Head and Neck Surgery (Capital Medical University), Ministry of Education, Beijing, China, Beijing, China. / Department of Hearing, Speech and Language Sciences, Ohio University, Athens, OH, United States.
雑誌名	JMIR formative research

DOI	10.1038/s41598-025-34371-y
PMID	41486270
PubMed URL	https://pubmed.ncbi.nlm.nih.gov/41486270/
発行年	2026
著者名	Gao Yuanjing, Gu Difei, Li Juan, Niu Zihan, Liu Rui, Luo Yanwen, Zhou Mengyuan, Xiao Mengsu, Mao Feng, Zhou Yidong, Jiang Yuxin, Li Hongsheng, Lu Man, Zhu Qingli
雑誌名	Scientific reports

DOI	10.1007/s11357-025-02049-y
PMID	41454175
PubMed URL	https://pubmed.ncbi.nlm.nih.gov/41454175/
発行年	2025
著者名	Lehoczki Andrea, Ungvari Zoltan, Szappanos Ágnes, Fekete Mónika, Gunkl-Tóth Lilla, Nagy György
雑誌名	GeroScience

DOI	10.1007/s12672-025-04268-3
PMID	41391063
PubMed URL	https://pubmed.ncbi.nlm.nih.gov/41391063/
発行年	2025
著者名	Khalvati Bagher, Kavousi Kaveh, Behmard Esmaeil, Keyhanipour Amir Hosein, Arabfard Masoud
雑誌名	Discover oncology

ChatGPTとDeepSeekによる中国語の聴覚士資格試験の比較：観察研究