HTML文件的文本信息预处理技术
《计算机工程》2006年05期 王志琪;王永成 下载(797)被引(46)


相关文章推荐
- 稀疏数据下结合词向量的短文...
- 针对短文本缺乏足够共现信息所产生的词与词之间弱连接,且难以获取主题词的情况,导致面向短文本分类工作需要人工标注大量的训练样本,以及产生特征稀疏和维度爆炸的问题,...[详细]
- 《计算机应用研究》2022年03期
- 任意方向自然场景文本识别
- 自然场景文本识别是计算机视觉领域一项极具挑战性的任务,为此提出一种适用于任意方向的自然场景文本识别算法。使用高分辨分割网络作为基础框架提取文本的空间信息,利用卷...[详细]
- 《重庆邮电大学学报(自然科学版)》202...
- 基于Encoder-Decoder框架的...
- 针对复杂的自然场景下文本较难识别的情况,特别是对不规则文本的识别仍很具挑战性,提出了一种具有注意机制的双监督网络。考虑到在现实世界中阅读单词时通常不会在脑海中纠...[详细]
- 《计算机工程与应用》2022年06期
- 基于深度强化学习的文本生成...
- 文本生成任务需要对大量词汇或语句进行表征,且可将其建模为序列决策问题.鉴于深度强化学习(deep reinforcementlearning,DRL)在表征及决策方面的优良性能,DRL在文本生成...[详细]
- 《天津科技大学学报》2022年02期
- 金融学文本大数据挖掘方法分...
- 通过回顾历史文献可知,传统研究主要研究文本分析常用方法,对于文本大数据挖掘实施过程关注较少。本文阐述了文本大数据挖掘的主要方法,阐述在此过程中获取、预处理、表示...[详细]
- 《互联网周刊》2022年09期
- 浅谈在线英语教学云端如何奏...
- 基于线上教学的局限性,不见面而"不停学",教之困、学之难在何处?文章将从文本解构、建构、重构、再构这四部曲段为重点,阐述如何利用线上的有利条件,梳理文本的知识链,提升云...[详细]
- 《考试周刊》2021年A3期
- 基于深度学习的车载屏幕文本...
- 车载屏幕文本图片显示内容丰富、背景多样性、文本信息较多且大小、方向不定等问题,导致文本检测与识别过程中出现准确率低、检测速度慢的问题,因此提出了一种基于深度学习的...[详细]
- 《光电子·激光》2021年04期
- 短文本分类模型的优化及应用
- 不同于长文本,短文本信息量缺乏,在研究中通常难以获得丰富的语义特征并且难以提取完整的句法特征,因此短文本分类模型的分类效果有待提升。针对这个问题进行了研究,基于Res...[详细]
- 《计算机应用研究》2021年06期
- 自然场景文本检测与识别的深...
- 许多自然场景图像中都包含丰富的文本,它们对于场景理解有着重要的作用。随着移动互联网技术的飞速发展,许多新的应用场景都需要利用这些文本信息,例如招牌识别和自动驾驶等...[详细]
- 《中国图象图形学报》2021年06期
- 分层文本分类在警情数据中的...
- 分层文本分类在现实中应用比较广泛,在数据不理想的情况下,充分利用分层结构信息对提高分类效果有很大的帮助。针对警情数据,为了充分利用其现有的分层结构信息,缓解数据严重...[详细]
- 《现代计算机》2021年23期
- 基于多粒度信息的中医文本关...
- 中医领域知识主要是以文本的形式存在,具有无规律的语言特性,中医知识的有效挖掘对充分利用文本中蕴藏的经验知识具有重要作用,信息抽取任务是中医知识管理的重要子任务,而关...[详细]
- 《电脑知识与技术》2021年27期