Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于流匹配模型的语音转换方法、装置、设备及存储介质,涉及语音转换技术领域,可应用于金融及医疗领域,包括:获取源语音和目标语音;分别提取源语音的第一语音特征以及目标语音的第二语音特征,第一语音特征包括源语音的内容特征和韵律特征...
  • 本发明公开了一种基于语法信息的藏语韵律结构预测方法,涉及语音合成技术领域,应用于藏语语音合成中韵律结构预测领域中。该一种基于语法信息的藏语韵律结构预测方法,包括S1,完成藏文解析与虚词接续量化,提取语法概率、层级焦点与停顿差异,预处理后存储...
  • 本发明提供了一种基于语境自适应的多轮交互情感语音合成方法及系统,属于语音合成技术领域,该方法包括:获取邻近单轮历史语音为语境窗口的即时多轮对话与当前待合成文本;通过两阶段训练的语境自适应特征预测器,直接从历史语音信号中解构并预测情感及多维副...
  • 本发明公开一种基于强化学习的语音文本匹配方法,通过获取多个待匹配训练样本以及每个待匹配训练样本的匹配训练样本。根据多个待匹配训练样本以及多个匹配训练样本,构建语义特征空间。根据语义特征空间内的多个关键锚点、多个待匹配候选训练样本、多个匹配候...
  • 本发明涉及数据分析处理相关技术领域,具体包括基于语音识别的呼叫数据智能分析处理方法及系统,方法包括:对语义特征标准化向量和中断特征标准化向量进行多头自注意力机制编码学习,将编码学习结果输入与编码器连接的解码器,根据多个呼叫处理时长参数对呼叫...
  • 本发明公开了一种融合AI视觉信息的智能语音识别与交互系统及方法,涉及语音识别技术领域;本发明通过同步采集音频与RGB‑D视频流,利用双流卷积神经网络并行提取声学特征、视觉唇语特征及三维空间交互特征;通过构建跨模态动态门控融合网络,结合实时信...
  • 本申请提出了一种基于矿山领域知识增强的语音指令解析方法及系统,该方法包括:构建矿山领域知识图谱;建立多任务联合学习模型,并利用矿山作业场景下的语音指令对所述多任务联合学习模型进行训练;通过LSTM网络构建DST模块,并基于强化学习算法训练语...
  • 本发明涉及语音识别技术领域,且公开了动态语音指令解析与分配方法,所述方法包括如下步骤:采集多源语音指令输入数据,生成原始语音指令数据集,对所述原始语音指令数据集进行语音信号预处理,生成标准化语音指令数据,在进行动态语音指令解析时,通过语音信...
  • 本公开提供了一种语音活动检测时长的配置方法、装置、电子设备、可读存储介质和计算机程序产品,涉及语音处理领域,尤其涉及语音识别、语音交互、车载操作系统技术领域。实现方案为:利用经训练的大模型,确定用户当前输入信息的第一语义信息,其中,所述第一...
  • 本申请属于语音信号处理技术领域,提供了一种抗干扰语音唤醒方法,包括:先获取语音信号,再通过信号处理子网络进行噪声抑制输出增强特征,基于增强特征分别通过唤醒声学模型和唤醒解码器输出第一判别结果和场景识别结果,通过唤醒声学模型和端到端唤醒判别子...
  • 本发明涉及语音信号处理技术领域,具体为一种基于深度学习的实验室强噪声环境语音识别方法。包括:获取待识别信号并利用增益控制进行能量包络调节,根据背景声压级实时补偿增益以输出实验室异质信号;将信号输入双支路特征提取器,利用Transformer...
  • 本发明涉及一种医疗场景多模态留言识别处理方法及系统,该方法包括:根据采集医生的语音信号以及环境噪声水平、人员位置和活动强度,动态调整语音识别参数,得到语音输入数据;根据语音输入数据,得到经纠错的文字信息;根据经纠错的文字信息,生成结构化展示...
  • 本发明公开了一种支持实时语音打断的智能对话系统及方法,涉及人机交互技术领域。所述系统包括:语音活动检测模块、语音识别模块、对话管理与LLM交互模块、语音合成模块以及打断控制模块。其中对话管理与LLM交互模块用于管理对话状态和上下文,以及调用...
  • 本申请公开了一种语音控制方法、系统、设备、存储介质及程序产品,涉及工业设备控制与人工智能交叉技术领域,包括:获取语音数据;通过预训练的NLP语义理解模型对语音数据进行文本转换及语义解析,得到语义解析结果;结合语义解析结果和预设校验机制,生成...
  • 本申请涉及一种语音控制方法、系统及网络设备,所述方法包括:获取多组初始语音数据;多组初始语音数据是由多个语音交互设备响应于目标语音指令分别采集的语音数据;基于多组初始语音数据的相位信息确定目标声源位置;基于目标声源位置对多组初始语音数据进行...
  • 本申请公开了一种语音识别方法、装置、设备、存储介质及程序产品,涉及语音处理技术领域,包括:响应于用户语音指令中包含指示代词,确定用户在发出所述用户语音指令时的视线指向区域;响应于所述视线指向区域包含至少两个设备,根据所述用户在发出所述用户语...
  • 本发明公开了一种复合机器人语音指令识别方法及系统,获取所述多个语音信号,并对所述语音信号进行预处理,得到对应不同语音来源的独立语音指令信号,提取所述独立语音指令信号的语音特征,并生成指令文本,解析所述指令文本的指令语义,将所述指令语义与预存...
  • 本发明涉及计算机技术领域,具体涉及一种双屏一体机中手语识别与展示方法与系统,方法包括:通过摄像头采集聋哑人做出的手语姿态,得到待识别手语数据;对待识别手语数据进行预处理后,将待识别手语数据输入AI智能手语识别模型,以输出与待识别手语数据对应...
  • 本发明公开一种基于声纹识别的智能助手多用户交互方法及系统, 涉及数据交互技术领域;包括:步骤1:建立声纹模型从语音信号中提取具有区分度的声纹特征,为后续的用户身份识别提供基础数据;步骤2:通过相似度计算和智能阈值调整,识别当前交互用户身份,...
  • 本说明书实施例公开了一种船舶控制器离线语音指令控制方法及系统。其中,方法包括获取船舶环境语音信号、并转换为第一数字音频流;对第一数字音频流进行音频前端增强处理;基于本地轻量级神经网络模型,对第一音频特征进行唤醒词本地离线检测;获取第二音频特...
技术分类