資源簡介
主動學習通過選擇現有模型中未充分訓練的數據進行迭代訓練,從而利用少量標注數據訓練出較高性能的模型。
傳統的主動學習方法只關注數據本身的信息量而忽略了該數據是否孤立。論文提出一種改進的主動學習方法,利用相似病
歷中出現的詞匯往往雷同的特點,以文檔中文字的分布衡量其在樣本集的普遍程度,并以此對信息量進行加權。而后實現
該方法,并進行了與消極學習和傳統主動學習方法的對比實驗。結果表明,該方法相對消極學習與傳統的主動學習方法,
效果有明顯提升,能夠減少對標注數據的需求。
代碼片段和文件信息
- 上一篇:隨機搖號器
- 下一篇:廣工信工信號與系統考試試卷
評論
共有 條評論