特牛生活网

电子病历命名实体识别NER_病例ner-CSDN博客

网友收藏
文章浏览阅读6.1k次,点赞4次,收藏22次。生成数据集医生给的标签格式将命名实体和标签当成jieba分词中的分词和词性,更新到jieba词典中,然后对病历文档进行分词,按照BIO标注每个字,每句话结束用空格分开。 按照1:2:12的比例将病历数据保存到dev/test/train三个文件中 数据加工1、将数据转换成BIOES标注,增加了ES,因为标注信息变多了特征会更丰富。2、给每个char和t..._病例ner
标签:病例ner