发明

基于大语言模型的问题答案生成方法、装置、设备及介质2025

2024-06-01 08:05:56 发布于四川 3
  • 申请专利号:CN202410405618.X
  • 公开(公告)日:2025-11-04
  • 公开(公告)号:CN118093830A
  • 申请人:北京世纪好未来教育科技有限公司
摘要:本公开提供一种基于大语言模型的问题答案生成方法、装置、设备及介质,方法包括:将问题文本输入预先训练的问答模型,由问答模型基于问题文本进行逐字符预测并输出当前预测字符,响应于当前预测字符为预设的目标字符,将问答模型输出的当前预测字符及之前的所有预测字符输入预先训练的思维链模型中,由思维链模型基于当前预测字符及之前的所有预测字符生成当前预测字符对应的思考表示并输出;获取思维链模型输出的思考表示并将思考表示输入问答模型,由问答模型思考表示继续进行逐字符预测,基于问答模型输出的所有预测字符,生成问题文本对应的答案。本方案实现了对问答模型的思考过程进行压缩,缩短了问答模型的输出响应时间。

专利内容

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 118093830 A (43)申请公布日 2024.05.28 (21)申请号 202410405618.X (22)申请日 2024.04.03 (71)申请人 北京世纪好未来教育科技有限公司 地址 100085 北京市海淀区小营西路10号 院1号楼B座7层701室1号 (72)发明人 刘子韬 刘天乔 刘常堃  (74)专利代理机构 北京开阳星知识产权代理有 限公司 11710 专利代理师 陈洁 (51)Int.Cl. G06F 16/332 (2019.01) G06N 5/022 (2023.01) G06N 5/04 (2023.01) 权利要求书3页 说明书15页 附图4页 (54)发明名称 基于大语言模型的问题答案生成方法、装 置、设备及介质 (57)摘要 本公开提供一种基于大语言模型的问题答 案生成方法、装置、设备及介质,方法包括:将问 题文本输入预先训练的问答模型,由问答模型基 于问题文本进行逐字符预测并输出当前预测字 符,响应于当前预测字符为预设的目标字符,将 问答模型输出的当前预测字符及之前的所有预 测字符输入预先训练的思维链模型中,由思维链 模型基于当前预测字符及之前的所有预测字符 生成当前预测字符对应的思考表示并输出;获取 思维链模型输出的思考表示并将思考表示输入 问答模型,由问答模型思考表示继续进行逐字符 A 预测,基于问答模型输出的所有预测字符,生成 0 问题文本

最新专利