首页 热门资讯文章正文

腾讯申请用于大语言模型微调的方法等专利,使模型在各垂直领域性能显著提升

热门资讯 2025年08月06日 18:45 1 admin

金融界2025年8月6日消息,国家知识产权局信息显示,腾讯科技(深圳)有限公司申请一项名为“用于大语言模型的微调的方法、装置、设备和存储介质”的专利,公开号CN120430372A,申请日期为2024年01月。

腾讯申请用于大语言模型微调的方法等专利,使模型在各垂直领域性能显著提升

专利摘要显示,本公开的实施例提供了一种用于大语言模型的微调的方法、装置、设备和计算机可读存储介质。该方法通过对待微调的大语言模型的性能进行测试,收集该大语言模型预测错误的样本集合,并基于这些预测错误的样本的真实类别和错误预测类别对这些预测错误的样本进行分类,即对大语言模型的预测错误进行分类,继而利用经训练的预训练语言模型来分析对于这些预测错误产生的原因,并基于这些原因生成具有相同错误情况的相似错误样本,以对模型进行针对性的微调,从而消除过拟合现象。该方法能够更好地分析模型在不同类型错误上的表现,并且可以更深入地了解并解决模型在特定场景下的过拟合问题,使模型在各个垂直领域的性能得到显著提升。

天眼查资料显示,腾讯科技(深圳)有限公司,成立于2000年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本200万美元。通过天眼查大数据分析,腾讯科技(深圳)有限公司共对外投资了15家企业,参与招投标项目263次,财产线索方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可527个。

本文源自金融界

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动