首页 百科大全文章正文

广联达申请非矢量文档预处理相关专利,提高大语言模型识别准确率

百科大全 2025年08月02日 15:36 2 admin

金融界2025年8月2日消息,国家知识产权局信息显示,广联达数字科技(广州)有限公司申请一项名为“非矢量文档的预处理方法、装置、设备和可读存储介质”的专利,公开号CN120411984A,申请日期为2024年01月。

广联达申请非矢量文档预处理相关专利,提高大语言模型识别准确率

专利摘要显示,本发明公开了一种非矢量文档的预处理方法、装置、设备和可读存储介质,该方法包括:获取待识别非矢量文档,其中,待识别非矢量文档包含用于大语言模型识别的信息;对待识别非矢量文档进行格式转化,生成待识别图片;将待识别图片输入至训练完成的版面分析模型,得到待识别图片的局部区域对应的标识和位置坐标,其中,版面分析模型为Layout神经网络检测模型;通过局部区域对应的标识和位置坐标提取待识别图片的局部区域所涵盖的类型数据;将所有类型数据进行整合,生成目标输入数据,以实现大语言模型对待识别非矢量文档的识别。本发明通过借助版面分析Layout技术,能够还原和保存了原始非矢量文档的结构化信息,以提高大语言模型的识别准确率。

天眼查资料显示,广联达数字科技(广州)有限公司,成立于2021年,位于广州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本20000万人民币。通过天眼查大数据分析,广联达数字科技(广州)有限公司参与招投标项目357次,专利信息23条,此外企业还拥有行政许可15个。

本文源自金融界

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动