基于預訓練模型的基層治理敏感實體識別方法
所屬分類:技術論文
上傳者:zhoubin333
文檔大小:3658 K
標簽: 預訓練語言模型 基層治理 中文命名實體識別
所需積分:0分積分不夠怎么辦?
文檔介紹:基層治理產(chǎn)生的大量敏感數(shù)據(jù)可通過數(shù)據(jù)脫敏去除隱私內(nèi)容,但這些數(shù)據(jù)包含較多非結(jié)構(gòu)化文本數(shù)據(jù),難以直接進行數(shù)據(jù)脫敏。因此,需要對非結(jié)構(gòu)化文本數(shù)據(jù)進行命名實體識別以提取敏感數(shù)據(jù)。首先把敏感實體分為16類并對信訪文本進行標注,輸入層表示采用預訓練模型BERT,編碼層利用雙向長短時記憶網(wǎng)絡汲取上下文信息,解碼層通過條件隨機場模型優(yōu)化序列,構(gòu)建了較高精度的基層治理敏感實體識別模型。針對脫敏工作需要,改變假陰性和假陽性的loss權重,并采用敏感實體框選率輔助評價模型性能。在基層治理信訪數(shù)據(jù)集和公共數(shù)據(jù)集MSRA上進行實驗,F(xiàn)1值分別為88.38%和90.11%,相較于基準模型提升了4.64%和3.78%。該模型可應用于非結(jié)構(gòu)化文本的敏感實體識別,識別成功率高。現(xiàn)有評價指標未能較好地反映敏感實體的間接推理關系,應當探索更完善的敏感實體評價體系。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 久热996re这里有精品 | 露脸超嫩97后在线播放 | 黄色免费网站在线观看 | 麻豆日韩国产精品欧美在线 | 在线观看亚洲成人 | 在线免费观看黄色小视频 | 成年影院在线看网站免费 | 日日噜噜夜夜躁躁狠狠 | 一级做a爰片性色毛片武则天五则 | 精品国产高清自在线一区二区三区 | 久久国产精品久久 | 看片网站在线观看 | 青青成人福利国产在线视频 | 成年网在线观看免费观看网址 | 国产色视频在线观看免费 | 最近更新在线中文字幕一页 | 国产精品亚洲二区 | 欧美 日韩 国产 在线 | 最近韩国日本高清免费观看 | 欧美日韩国产剧情 | 欧美视频区 | 外国成人xxx在线视频 | 天天摸夜夜摸爽爽狠狠婷婷97 | 成人网视频在线观看免费 | 午夜人体视频 | 久久精品视频8 | 激情久久免费视频 | 亚洲狠狠插 | 婷婷六月久久综合丁香乐透 | 伊人亚洲综合网 | 日韩高清在线免费看 | 亚洲免费一区二区 | 九九伦理影院手机观看 | 中文字幕 亚洲一区 | 美女黄免费网站 | 五月天婷婷免费视频观看 | 毛片高清| 狠狠操她| 综合网激情五月 | 日韩欧美亚洲综合久久99e | 波多野结衣一区 |