开放能力
开发平台
行业应用
生态合作
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
场景方案
部署方案
图像搜索
相同图片搜索 相似图片搜索 热门 商品图片搜索
车辆分析
图像处理
图像识别
开发平台
场景方案
部署方案
人像特效
人脸融合 人像分割
人体分析
行为分析
开发平台
场景方案
部署方案
工具箱
虚拟现实
场景方案
文本审核 热门
语言处理应用技术
机器翻译
开发平台
场景方案
部署方案
工具集
舆情分析
舆情平台 舆情API
知识生产与理解
智周 智珠 新品
大数据分析
大数据风控
统计与推荐
大数据营销
场景方案
大数据生态
知识图谱Schema
图数据库BGraph 邀测
开发平台
场景方案
行业应用
智能工业
智能零售
企业服务
智能政务
智能教育
智能农业
信息服务
智能园区
智能硬件
查找合作伙伴
深度学习专项合作计划
企业能力认证
硬件专项合作计划
品牌授权体系
百度AI加速器
百度大脑创新体验中心
合作咨询
AI公众号
关注AI公众号
获取AI资讯,体验AI能力
远场语音开发套件
端到端的软硬一体方案,包含麦克风阵列和开发板,支持声源定位、噪声消除等信号处理算法,5米内有效拾音,支持远场唤醒、远场识别、语音合成能力,使语音开发评估更简便、更高效
方案介绍
应用场景
特色优势
相关推荐
方案介绍
多种麦克风阵列选型
环形6+1麦、线形4麦、三角形3麦三种麦克风阵型,适配于智能音箱、智能家居、智能机器人、车载设备等多种远场语音交互场景
超强算力芯片
四核A35,强悍的计算能力,提供差异化音视频编解码能力,满足不同开发者的定制化开发需求
先进的信号处理算法
基于非线性消除的AEC技术、增强GSC的波束生成技术,支持噪声消除、方向固定的麦克风阵列算法
高精度的语音唤醒
基于DeepCNN的唤醒词整词置信度技术,纯端侧唤醒词检测,高精度低延迟超低误报,5米也能轻松唤醒
高精准的语音识别
基于Deep Peak2模型,支持中文标准普通话、带口音的普通话,系统稳定性更强、准确率更高、解码速度更快
流畅自然的语音合成
基于拼接和WaveNet相结合的技术方案,实现具备丰富情感、高度拟人、流畅自然的语音合成体验
应用场景
智能家居
智能机器人
车载设备
智能家居
适用于智能音箱、智能电视及其他传统家居设备,通过远场语音与智能家居设备进行交互,查询并控制智能家居设备,提升交互体验。产品包括小度在家带屏智能音箱、小度智能音箱、小度智能音箱Pro等小度产品、多款创维TV等智能电视产品
合作案例
小度智能音箱
创维
特色优势
完整方案、快速接入
提供完整的硬件模组和软件开发套件,便于接入及方案评估;标准Linux、Android原生ROM,方便扩展和定制
领先的远场语音交互体验
1、3、5米远场有效拾音,支持回声消除、360度声源定位等,高精度的端云一体化远场语音方案
覆盖多场景语音交互
涵盖智能音箱、智能家居、机器人、车载等远场语音交互场景,高效满足多场景的远场语音交互
即刻获得AI能力
快速与我们取得联系,请点击下方的合作咨询
合作咨询