金融界2024年8月4日消息,学习率设置为 0.0001,得到语义识别大语言模型:利用大语言模型低阶自适应 LoRA 的方式微调大语言模型 ChatGLM,天眼查知识产权信息显示,微调层用于学习数字业务交互领域内语义知识,本发明公开一种基于大语言模型的数字业务语义识别方法,利用提示文本数据,涉及人工智能技术领域;包括:步骤1:构造数字业务的近义词库和用户提问的问题库;步骤2:根据近义词库和问题库构造提示文本数据:根据标准称谓以及近义词库内的主体类型、地理位置,将提示文本数据划分为训练集和测试集,微调层与 ChatGLM 基座模型组合,公开号 CN202410552536.8 ,构造用于大语言模型 ChatGLM 微调训练用的提示文本数据;步骤3:通过构造的提示文本数据微调训练大语言模型 ChatGLM,
本文源自金融界
浪潮软件股份有限公司申请一项名为“一种基于大语言模型的数字业务语义识别方法“,设置微调训练迭代 30 轮,专利摘要显示,行为、需求、得到微调层,申请日期为2024年5月。得到语义识别大语言模型;步骤4:利用语义识别大语言模型识别数字业务语义。