Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供一种基于多对多的动态相似性聚合的联邦学习方法及系统,涉及联邦学习技术领域,方法包括:随机下发中间件模型至客户端并获取客户端训练更新后的中间件模型;计算两更新后的中间件模型的欧氏距离及余弦距离并进行归一化加权处理以获得两更新后的中间...
  • 本发明公开了一种基于结构化剪枝与知识蒸馏的车联网联邦学习系统,适用于车联网及物联网的资源受限环境。首先,在路侧单元(RSU)端设计一种智能车辆选择算法,用于在每轮训练中选择具有代表性的车辆子集参与模型训练。其次,在全局模型分发阶段,通过结构...
  • 本发明提供一种联邦学习方法、装置、网络设备、介质及程序产品,涉及联邦学习技术领域。所述方法包括:针对每个第二网元,根据模型分割点分割模型,获取第二网元对应的第一子模型和第二子模型;向第二网元发送对应的模型分割信息;获取第二网元发送的训练后的...
  • 本申请提供了一种模型处理方法、装置、设备、存储介质及计算机程序产品;方法包括:从待迁移模型中确定出第n个模块,其中,第n个模块包含至少一个算子,n为依次递增的正整数;将第n个模块添加至部署于第一硬件加速设备的模型中,得到第一模型,并将第n个...
  • 本说明书提供了一种征信评估模型的迁移学习方法及征信评估方法。该征信评估模型的迁移学习方法包括:获取样本数据;将存在共性特征的源域数据和目标域数据映射至同一特征维度,并确定该源域数据和目标域数据分别与特征维度之间的映射关系,以及,基于所确定的...
  • 本申请提供了一种基于数据处理方法、装置、设备、存储介质及产品,包括:获取参考模型基于训练问题生成参考答案的推理路径,以及待训练模型基于训练问题生成推理答案的推理路径,基于参考模型和待训练模型分别执行各自推理路径中运算出的注意力信息,确定各自...
  • 本发明提供了一种教师模型引导的学生模型扩散自蒸馏方法,包括:载入预训练的教师模型和学生模型,并开始训练所述学生模型;从训练数据中分别提取教师特征和原始学生特征;通过所述教师模型引导所述扩散模型对所述原始学生特征进行去噪采样,生成对应的去噪学...
  • 本发明公开了一种基于梯度敏感度的大语言模型微调方法、装置及存储介质,属于人工智能与机器学习技术领域。该方法的核心在于:首先从全量微调数据中抽取少量样本作为探针数据集对模型进行初步训练;随后,计算模型各参数的梯度并据此评估其梯度敏感度;根据预...
  • 本发明属于黑盒对抗攻击技术领域,公开了一种基于代理函数优化和特征概率扩散的黑盒对抗攻击方法,本发明针对传统的规避攻击无法扰动基于机器学习的网络入侵检测系统以及黑盒对抗样本攻击查询次数多,计算开销大和对抗样本的通用性等问题,设计了一种将对抗样...
  • 本发明属于自然语言处理领域中的对抗攻击技术,涉及一种基于表情符号扰动的大语言模型黑盒对抗样本生成优化方法。该方法通过构建表情符号插入的扰动表示方式,采用连续编码与离散插入相结合的机制,将表情符号的插入位置与插入类型建模为可在连续空间中求解的...
  • 本发明公开了一种基于强化学习大模型的智能决策方法,包括:获取环境状态数据并进行特征提取处理,编码融合形成统一语义状态表示;将语义状态输入强化学习大模型处理,并行生成结构化决策计划和决策证书;基于计划与证书进行约束感知重构,构建子决策单元并生...
  • 一种模型泛化能力提升方法、装置、设备及可读存储介质。该方法包括:通过收集用户偏好反馈,使得模型优化能够直接利用领域使用者(用户)的局部知识和意图,无需获取敏感的原始场景数据或大量标准标注,降低了数据门槛与隐私风险;根据所有偏好反馈构建奖励模...
  • 本说明书实施例提供一种链路生成、强化学习、数据处理方法、设备及存储介质。该方法中,获取第一数据处理任务的第一任务需求;根据第一任务需求,从多个备选算子中匹配所需的多个第一算子并基于多个第一算子生成第一待优化数据处理链路;根据第一待优化数据处...
  • 本申请提供一种基于通用过程奖励建模的机器人强化学习训练方法、装置及电子设备,涉及人工智能和机器人控制技术领域,该方法包括:获取与强化学习训练任务相关的机器人操作演示视频,并基于机器人操作演示视频对预先训练的通用过程奖励模型进行微调,得到目标...
  • 本发明公开一种基于COT提示与自监督奖励生成的强化学习方法及系统,包括:在输入提示前添加预设数量的高质量COT样例,形成增强提示;利用策略模型基于增强提示生成多个输出;通过锚点模型对多个输出进行合成,生成合成参考;基于合成参考的答案是否能够...
  • 本申请实施例提供了一种强化学习处理方法、存储介质、电子装置及计算机程序产品,该发送方法包括:根据用于输出分析的机器学习模型的模型推理获取结果反馈,并根据结果反馈生成强化学习所需的奖励和/或状态;根据奖励和/或状态从第一实体获取动作反馈,可以...
  • 本发明公开一种基于主动学习与难例挖掘的AI打标闭环方法,该方法通过训练初始模型后,并行计算不确定性、代表性、多样性三维度价值指标,经闭环反馈控制器动态加权筛选高价值样本;识别难例,采用DBSCAN聚类并检索相似样本扩充,存入动态池;分发标注...
  • 本申请提供一种用于旅游推荐的自监督学习模型的训练及推荐方法,涉及数据处理技术领域,方法包括:对基于游客文旅数据,构建异构信息图进行边随机掩码后输入目标编码器提取特征,获得节点嵌入;通过互相关解码器对每两个节点的节点嵌入进行计算和结果拼接获得...
  • 本发明公开了一种基于集成学习的无监督深度神经网络搭建方法,具体涉及神经网络技术领域,获取井下检波器的连续波形记录,经预处理得到离散波形样本并分配索引,构建伪标签池,初始化并行神经网络;执行基于隐状态一致性的前向校正训练,动态修正伪标签并更新...
  • 本申请公开了一种神经网络模型剪枝方法及系统,涉及模型剪枝领域,包括:获取第一神经网络模型;对模型中的标准层进行替换,获得第二神经网络模型;将模型中的每一个残差模块中添加相关性门控,用于对相关性传播进行控制,线性层的输出端添加稀疏滤波器,用于...
技术分类