面向真實世界的知識挖掘與知識圖譜補全研究(四):真實世界數據標注平臺搭建及基于預訓練語言模型的自動化抽取方法探索
摘要: 目的 探索搭建真實世界數據標注平臺,并比較檢索增強生成式技術(retrieval augmented generation,RAG)結合大語言模型,及預訓練語言模型的預訓練-微調方法的真實世界數據提取效果。方法 以真實世界電子病歷數據中的膀胱癌病理記錄為例,搭建真實世界數據標注平臺,并基于平臺標注數據比較RAG結合GPT-3.5,及基于BERT、RoBERTa模型的預訓練-微調... ...
(共8頁)
開通會員,享受整站包年服務