首页 热门资讯文章正文

达佳互联申请文本语料筛选专利,准确筛选出高质量的文本语料

热门资讯 2025年08月07日 05:13 2 admin

金融界2025年8月6日消息,国家知识产权局信息显示,北京达佳互联信息技术有限公司申请一项名为“文本语料的筛选方法、装置、电子设备及存储介质”的专利,公开号CN120430293A,申请日期为2025年04月。

达佳互联申请文本语料筛选专利,准确筛选出高质量的文本语料

专利摘要显示,本公开提供了一种文本语料的筛选方法、装置、电子设备及存储介质,属于人工智能技术领域。方法包括:获取多个第一文本语料;从多个第一文本语料中,筛选出语料质量符合质量条件的多个第二文本语料;从多个第二文本语料中,筛选出语料中的事实知识属于目标学科的多个第三文本语料,目标学科与目标大语言模型的模型任务相关;从多个第三文本语料中,筛选出语料中事实知识所属的知识层级符合层级条件的多个目标文本语料,知识层级用于指示语料中事实知识的深度,层级条件包括第三文本语料中事实知识的深度所要达到的标准,多个目标文本语料用于训练目标大语言模型。

天眼查资料显示,北京达佳互联信息技术有限公司,成立于2014年,位于北京市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本600000万美元。通过天眼查大数据分析,北京达佳互联信息技术有限公司共对外投资了20家企业,参与招投标项目17次,财产线索方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可31个。

本文源自金融界

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动