备案说明与算法公示
根据《互联网信息服务深度合成管理规定》等相关法律法规要求,深圳市百麒晟科技有限公司已完成“云果多模态对话生成算法” 的备案工作, 并按要求向社会公示算法基本情况。
一、备案信息
算法名称:云果多模态对话生成算法
备案号:网信算备440305657081101250013号
备案类型:生成合成类
算法应用场景:云果 AI 助手系列语音对话系统
二、算法基本原理(公示节选)
云果多模态对话生成算法主要由语音识别、对话管理、多模态内容生成和语音合成四个核心模块组成:
- 语音识别:通过语音检测识别声音信号结束,利用声学模型对音频进行识别,将语音转化为文字,并进行 通用语义识别 。
- 对话管理:结合通用语义与专门语义识别,区分私人助理、公共知识、图片、音乐等请求类型,组织不同 模态内容生成 与多轮对话。
- 多模态内容生成:基于大语言模型生成公共类知识内容,基于图形模型生成通用自然风景图片,并通过自 然语言模型生 成个性化助理回复及音乐内容。
- 语音合成:通过发音与合成引擎,将文本内容合成为音频,实现从语音输入到语音输出的完整闭环。
三、算法运行机制与目的
算法接收用户在智能终端上的语音提问,将音频转为文本后进行关键词和意图提取。对于通过敏感词审核的合规请求,系统会分 别叠加提示词 (Prompt),调用大语言模型进行答复、调用图像模型或音乐平台生成相应内容,并最终以语音形式向用户播报结果。
算法的目标是通过多模态 AI 模型融合与云端—终端协同,为用户提供高效的工作与学习辅助工具,帮助用户获得个性化、可控、可解释的智能 服务。