李子不能和什么一起吃| 吃什么能排毒体内毒素| 熊猫为什么叫熊猫| 4月26日什么星座| 花对什么| 细菌性痢疾吃什么药| 姐姐的女儿应该叫什么| 来大姨妈吃什么水果好| 肠炎吃什么食物调理| 广东有什么市| 尿液有隐血是什么情况| dbm是什么意思| 嘴巴干苦是什么原因| 高血糖什么原因引起| 发烧后头疼是什么原因| 平步青云什么意思| 龙日冲狗煞南是什么意思| 你喜欢我什么我改| 二甲苯是什么东西| 口爆什么意思| 县级干部是什么级别| 什么叫做原发性高血压| 头晕眼花是什么原因| bug什么意思| 血常规挂什么科| 红楼梦为什么是四大名著之首| 杨桃有什么营养价值| 绝望是什么意思| ferragamo是什么牌子| 舌面有裂纹是什么原因| 肚子胀打嗝是什么原因| 新生儿睡觉突然大哭是什么原因| 干巴爹什么意思| 属鼠女和什么属相最配| 裙子搭配什么鞋子| 4ever是什么意思| 布鲁氏菌病是什么病| 心烦意乱焦躁不安吃什么药| 什么叫玄关| 火凤凰是什么意思| 不孕不育的症状是什么| 专属是什么意思| 丢钱是什么预兆| 身上长扁平疣是什么原因| 老公什么意思| 胆固醇高吃什么药| 电是什么| 什么是问题| 男的叫少爷女的叫什么| 什么人容易得尿毒症| 全身而退是什么意思| 窜稀吃什么药| 睡不着觉挂什么科| 175是什么码| 囡是什么意思| 小腿肿胀是什么原因| 人为什么会做春梦| 刷牙时牙酸是什么原因| l是什么意思| 胸口闷挂什么科| 公安局是干什么的| 猫在风水上代表什么| 忠武路演员是什么意思| 脂溢性皮炎是什么引起的| 胳肢窝痒是什么原因| 最聪明的动物是什么| 白虎是什么意思| 胆红素偏高有什么危害| 痔疮是什么原因引起的| 佩戴沉香有什么好处| 宝宝不爱喝水有什么好的办法吗| 屿字五行属什么| kappa属于什么档次| 阴道炎用什么栓剂| 晶莹剔透是什么意思| 属蛇的和什么属相最配| 属鼠的幸运色是什么颜色| 穆赫兰道到底讲的什么| 尽虚空遍法界什么意思| 胃肠功能紊乱是什么意思| 刘亦菲是什么国籍| 禁果什么意思| 这个季节适合种什么蔬菜| 淋巴肉为什么不能吃| 云母是什么| 什么的落日| 托人办事送什么礼物较好| 怀孕初期吃什么蔬菜好| 总是心慌是什么原因| 淋巴结挂什么科| 3月25号是什么星座| 声声慢是什么意思| 滑膜炎是什么病| 情绪价值是什么意思| 脸上长粉刺是什么原因引起的| 胃疼能吃什么水果| 龙和什么生肖相冲| 祸从天降是什么生肖| 农历五月初五是什么节日| 石花菜是什么植物| 天上的月亮是什么生肖| 嬲什么意思| 这是什么情况| b是什么单位| 愚者是什么意思| 口腔溃疡用什么药最好| 订盟是什么意思| eb病毒是什么病毒| 一什么不什么四字成语| 轻度肠上皮化生是什么意思| 花椒泡脚有什么功效| 白果有什么功效与作用| 酸奶什么时候喝好| 什么野菜降血糖| 海参是什么动物| 新生儿出院回家有什么讲究| 术后吃什么营养品好| cob是什么意思| 精神恍惚是什么症状| 纹绣是什么| 腔梗吃什么药| 什么兔子最好养| 阑尾炎挂什么科| 梦到装修房子是什么征兆| 胆固醇偏高吃什么好| 肾阴亏虚吃什么药| 手抖是什么原因| 右眼皮跳什么原因| 全血粘度低切偏高是什么意思| 肺肿了是什么病严重吗| 大便颗粒状是什么原因| 今天晚上吃什么| 度蜜月什么意思| 一语惊醒梦中人是什么意思| 端粒酶是什么| 减肥平台期什么意思| 皮肤过敏吃什么| 降血压喝什么茶| 249是什么意思| 热得直什么| 安厝是什么意思| dha孕妇什么时候吃| 霆字五行属什么| 牙龈肿了吃什么药| 塞上是什么意思| 幽门螺杆菌吃什么药好| 薰衣草什么时候开花| 什么是邮箱地址应该怎么填写| 勃起不坚吃什么药| 胰腺有什么作用| 不敢苟同是什么意思| 阴囊湿疹用什么药膏| 1940年中国发生了什么| 无名指戴戒指什么意思| 三月份是什么季节| qq2g在线是什么意思| dn是什么意思| 牙疼吃什么药效果好| 脚板痒是什么原因| 无水乙醇是什么| 关东煮为什么叫关东煮| 什么萌| 鹅口疮是什么原因引起的| 血小板压积偏低是什么意思| 公交车是什么意思| 冰粉籽是什么植物| 过敏性鼻炎用什么药| 右肺下叶钙化灶是什么意思| 子宫附件包括什么| 运动后恶心想吐是什么原因| 流弹是什么意思| b站是什么| 梦见自己理发是什么意思| 冬虫夏草生长在什么地方| 丁羟甲苯是什么| 丈夫的弟弟叫什么| 野兔子吃什么| 宫颈那囊是什么| 眼睛为什么老是流眼泪| 无什么什么什么| 鹿吃什么| 李子什么人不能吃| 九月初十是什么星座| 名列前茅的茅是什么意思| 郡肝是什么| 烧头七有什么讲究| 什么品种的鸡肉最好吃| dhc是什么| 蜂蜡是什么东西| 抗核抗体阳性是什么意思| 什么水果吃了对皮肤好| 557是什么意思| 梦见猫是什么预兆| 子宫内膜厚有什么危害| 荨麻疹什么东西不能吃| 女人怀孕的最佳时间是什么时间| 四月是什么月| 肌无力有什么症状| 盛情款待是什么意思| 鼻子流清水是什么原因| 天蝎座是什么性格| 九月初四是什么星座| 金牛女跟什么星座最配| 痔疮挂什么科| 什么叫前列腺钙化| 什么样的人容易高反| 想什么来什么是什么定律| 陕西有什么烟| 1997年属什么生肖| hip是什么意思| 霸王花煲汤放什么材料| 反将一军什么意思| 胃胀嗳气吃什么药最有效| 做梦梦见别人怀孕是什么意思| 壁虎的尾巴有什么作用| 阴道干涩是什么原因| 胀气是什么症状| 人为什么会得脑梗| 五月二十四是什么星座| 民政局是干什么的| 正三角形是什么| 梦到吃肉是什么意思周公解梦| 梦见打老公是什么意思| 金火是什么生肖| 梦魇什么意思| lyocell是什么面料| 什么的李子| 脑蛋白治疗什么病| 完蛋是什么意思| 手指甲有竖纹什么原因| 冰箱什么牌子好| 三点水加四读什么| 程度是什么意思| 3月3日是什么节| 支气管激发试验阴性是什么意思| 脖子上为什么会长丝状疣| 宝宝拉肚子吃什么好| 肛裂出血用什么药| 超敏c反应蛋白高是什么意思| 为什么过敏反复发作| 东北方是什么方位| 痛经什么感觉| 火龙果和香蕉榨汁有什么功效| 非诚勿扰什么意思| 易烊千玺什么星座| 双子座是什么星象| 背沟深代表什么| 木薯是什么| 月经是黑色的是什么原因| 少字加一笔是什么字| 大脑供血不足用什么药| 七个月宝宝可以吃什么辅食| 右耳朵热代表什么意思| 女性分泌物发黄是什么原因| 牛肉发绿色是什么原因| 安字属于五行属什么| 骨折忌口什么食物| 左旋是什么| 膀胱壁增厚毛糙是什么意思| 助理研究员是什么职称| 痛经挂什么科| 维生素c不能和什么一起吃| 普门品是什么意思| 灌肠什么感觉| 百度
资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

西安市档案馆(局)开展捡拾烟头垃圾主题实践活动

语音识别

常见问题

1.语音识别结果与音频内容不匹配

  • 语音识别返回结果与音频内容不匹配,例如:“嗨嗨嗨”、“嗯嗯嗯嗯嗯”、“什么”等错误返回。
  • 解决方法:排查音频采样率、声道、格式等参数是否符合接口规范。如与要求不符,需要用工具对音频进行转码,转码工具跳转

2.3300错误码怎么办?

  • 语音识别api使用的是HTTP POST方法, BODY里直接放置json, Content-Type头部为 application/json。 并非常见的浏览器表单请求(application/x-www-form-urlencoded或者multipart/x-www-form-urlencoded)。
  • 必填字段:format rate channel cuid token cuid token cuid token cuid token,请勿漏填。此外 (speech, len) 及 (url, callback) 这两组参数必须二选一,如果都填,默认处理第一组。
  • 必填字段如format rate channel cuid token,请勿漏填。此外 (speech, len) 及 (url, callback) 这两组参数必须二选一,如果都填,默认处理第一种,并确认音频时长截取为60s以下。

3.3309错误码怎么办?

  • wav和amr的音频,服务端会自动转为pcm,这个过程中导致转码出错。请确认下format及rate参数与音频一致,并确认音频时长截取为60s以下。

4.3301错误码怎么办?

  • 识别结果实际为空。可能是音频质量过差,不清晰,或者是空白音频。
  • 有时也可能是pcm填错采样率。如16K采样率的pcm文件,填写的rate参数为8000。

5.行业与场景限制

  • 根据工信部《综合整治骚扰电话专项行动方案》、《关于推进综合整治骚扰电话专项行动的工作方案》,相关能力不得用于商业营销类、恶意骚扰类和违法犯罪类骚扰电话类场景,也不支持在贷款、理财、信用卡、股票、基金、债券、保险、售房租房、医疗机构、保健食品、人力资源服务、旅游等场景的骚扰电话营销行为。

6. 商务合作的流程是怎样的?

  • 请在Speech官网底部点击“商务合作”,详细描述您的需求。或者在百度云提交工单申请合作。

7. 一句话说完后,如何控制不自动停止识别?/ 为何我静音一段时间后,自动停止了识别?

  • 关闭VAD即可。

8. 离线可以支持识别任意词识别(听写识别)吗?

  • 我们推荐使用在线识别,离线识别仅支持命令词识别。如果您有强烈、明确的离线任意词识别的场景,请详细描述您的需求,在官网底部点击“商务合作”,我们会有专人联系。

9. 觉得识别不准确怎么办?

  • 请对类似的语音做多次尝试,并整理录音文件、识别的日志(带sn)、期望的识别结果以及实际的识别结果文件,在QQ群或通过百度云工单提交给我们。

10. 为何我的App进入后台后,自动停止了识别/唤醒?

  • 3.0.5.6 版本进入后台后不再打断唤醒/识别
  • iOS后台唤醒会出现很多问题导致产品可用性不能满足上线要求,同时为了规避各程序间的冲突,sdk会主动停止唤醒。

具体问题如:

  • 与siri冲突,长按home键会被siri把录音能力夺取
  • 顶部出现红条
  • 无法唤起任何应用,即使程序自己都无法唤起
  • 程序被系统杀死的问题无解,即便通过类似hack(比如某些程序后台播放音频)的方式保证存活率,也会导致播放和录音冲突

    鉴于以上考虑,程序切到后台会自动停止唤醒功能。

11.如何同时集成语音识别和语音合成?两个.a名字是一样的,内容一样么?

  • 内容不一样,同时集成只需将.a换个名字重新导入即可。同名的资源文件内容是一样的。

12.集成到自身工程之后,启动报错“vad: start error”

  • 一般是因为资源文件没有正确引入。请参考demo工程资源文件的引入办法,并且在代码中检查获得资源文件的指针不为nil。

13. 识别时报错:“Server app name unknown”

  • 请确认填写了正确的 api_key, secret_key, app_id,且在官网正确绑定了包名。
  • 请确认您的应用的并发和日配额没有超限。

14. 语音识别iOS DEMO在Xcode15中报错提示libiconv.2.4.0 不存在

  • 在General-Frameworks, Libraries, and Embedded Content中移除libiconv.2.4.0,添加libiconv.2.tbd后重新编译。

语音合成

移动端SDK常见问题

1. Android播放多段长文本

建议使用sdk内部的队列缓存。 int speak(String text, String utteranceId);

如一开始一次性调用10次speak方法,收到合成结束的onSynthesizeFinish回调后(可以收到utteranceId参数),再加入1句新的。保持sdk内部队列中一直有10个句子。

SDK内部会按照队列次序不断合成。自动按照次序播放

2. Android控制播放暂停及自定义播放

SDK是无论何种场景都会一直播放。比如有电话接入,需要暂停播放。用户需要自行实现,收到系统电话接入的事件调用pause方法, 结束后调用resume方法。

如果觉得SDK的播放方式您不满意,可以调用synthesize() 方法仅合成不播放。通过onSynthesizeDataArrived 获取音频数据,自行处理播放。

3.Android高亮当前在读的文字

onSpeechProgressChanged()根据播放音频的时长百分比回调进度,由于每个字的发音不是等长的,和实际读的文字会有误差。当一次合成的文件较长时,误差尤为明显。

4. Android播放过程中切换发音人

在线发音人, 要求在引擎空闲时切换。 SDK内部有合成队列和播放队列。其中合成队列独立,调用的句子在合成队列结束后加入播放队列。

引擎空闲是指合成队列为空,即合成全部完成。 即onSynthesizeFinish中,收到的utteranceId为最后一个。utteranceId参数是speak或synthesize方法的第二个参数。

也可以随时调用stop方式,比如最近的一句话说完时,清空播放队列和合成队列,达到引擎空闲的状态。

具体请参见demo的SwitchSpeakerListener类。

5. ios如何同时集成语音识别和语音合成?两个.a名字是一样的,内容一样么?

内容不一样,同时集成只需将.a换个名字重新导入即可。同名的资源文件内容是一样的。

6. ios如何获得合成的音频数据

请参考Demo中的synthesizerNewDataArrived方法。注意合成的数据是逐段返回的,如果需要完整的音频,开发者自行拼接数据即可。

7. ios如何管理AudioSession

请开发者参考SDK头文件 BDS_SYNTHESIZER_PARAM_ENABLE_AVSESSION_MGMTBDS_SYNTHESIZER_PARAM_AUDIO_SESSION_CATEGORY_OPTIONS配置说明或者文档关于AVAudioSession部分。如果无法达成预期效果,建议收取合成的音频数据,自行播放。

8. ios如何实现后台播放、如何实现锁屏界面的播放、显示

SDK内部不会对后台、锁屏相关功能做任何控制,但会在必要的时候调用setActive接口对外部音频进行打断及恢复,会影响某些场景下的锁屏显示,如果开发者不希望SDK对AudioSession进行操作自己管理,可以通过参数配置接口,把BDS_SYNTHESIZER_PARAM_ENABLE_AVSESSION_MGMT对应的value设置为NO,即可屏蔽SDK内部的操作。建议开发者自行收取合成音频数据,播放音频的同时来实现相关功能。

9. 商务合作的流程是怎样的?

请在AI官网底部点击“商务合作”,详细描述您的需求。或者在百度云提交工单申请合作。

10. 如何反馈使用问题

在反馈问题之前,请开发者务必在Demo测试并复现。

通过各个渠道反馈问题时,请务必详细描述以下信息:

问题描述:(具体问题,稳定复现/概率)
SDK 版本:(是否已经切换到最新版本)
是否已在Demo中复现:请务必在Demo中复现遇到的错误。无法在Demo复现的问题相对难以定位原因。
 
若能在Demo中复现,请描述:
SDK:(SDK类型,版本号)
初始化引擎代码:(在线引擎、离线引擎代码片段)
APPID:
复现逻辑:(如何复现)
完整日志:(附上开启Debug模式的,从启动到结束的完整日志)

呼叫中心

常见问题:

Q:用户侧呼叫软件提示“407 COMPLETE”错误信息

A:检查log/mrcp_debug.log日志。看是否存在连接超时、请求参数不正确等错误。

Q:mrcp服务端口号如何配置?

A:在conf/unimrcpserver.xml进行配置,默认SIP端口5060。如果公司有防火墙限制,请记得打开相应端口。

Q:提示service unavailiable,MRCP session错误等

A:可能是mrcp server没有启动成功、网络不通等。如果使用MRCP自带测试工具测试正常,则可能是用户前端配置错误。

Q:提示“MRCP session has not opened after 5000 ms”错误

A:检查log/mrcp_debug.log日志。若无错误信息,则需检查FreeSWITCH配置。

Q:是否可以使用${SERVER_ROOT}/mrcp-server/bin中的asrclient进行识别?

A:asrclient仅为辅助测试验证工具,如果用来识别较长的音频,则可能会因说话停顿被VAD截断导致不能完全识别。

Q:是否有VAD功能?

A:系统自带VAD功能。

Q:语音识别时,日志中出现err_no:-2错误

A:音频不够清晰或者有环境噪声被误识别。可检查audio目录下相应音频是否清晰。相关错误码可查看错误码部分。

Q:是否可通过发送超时时间参数,用户在该时间内不说话则认为超时?

A:conf/mrcp-asr.conf中NO_INPUT_TIMEOUT_MS为全局默认超时时间,每次请求都有效。用户也可通过发送RECOGNIZER_HEADER_NO_INPUT_TIMEOUT自行设置单次请求超时时间,默认请求开始时开始计时。用户可通过在请求时发送RECOGNIZER_HEADER_START_INPUT_TIMERS为false设定开始时不计时,然后在合适的时机,发送RECOGNIZER_START_INPUT_TIMERS事件开始计时。

Q:是否有办法使用asrclient 批量识别多个文件 ?

A:不支持,请自行开发前端呼叫软件。

Q:合成日志出现“not supported voice name”错误

A:合成目前仅支持conf/mrcp-proxy.conf里默认配置的发音人。请不要在请求时设置SYNTHESIZER_HEADER_VOICE_NAME,或者设置为与配置中相同的发音人 fduxiaowen

Q:使用FreeSWITCH软电话听不到TTS声音

A:检查MRCP服务器audio目录下的pcm是否有生成的TTS音频。若存在正确音频,则MRCP TTS功能正常。需检查FreeSWITCH相关配置。

Q:在mrcp_debug.log里出现unsupportedcontent_type:application/xml是什么原因?

A:根据标准,识别请求content_type要写成application/srgs+xml、text/uri-list等。

Q:unimrcpserver.xml里面的sip-ip和sip-ext-ip应该怎么填写?sip-ip是本地ip,那sip-ext-ip呢?

A:sip-ext-ip文档中未要求填写,不用填写。

Q:mrcp server是在检测800ms无用户说话语音输入时,就认为一段话结束,执行asr吗?还是用户边说话边asr吗?

A:根据传送的语音流实时识别,默认识别时长55秒,说话间隔超过800ms截断。

Q:请问你们MRCP server返回的格式支持 NLSML 数据格式吗?

A:现在返回的识别结果,content-type就是application/nlsml+xml的。

Q:MRCP返回检测到说话得消息比较灵敏,噪声误识别有什么办法优化嘛?

A:可以在mrcp-asr.conf中DETECT_START_OF_INPUT_BY_VAD参数设置为0。参数改为0后,单字识别结果将会被忽略,只有SINGLE_WORD_WHTIL_LIST白名单中的单字可以被识别。

Q:遇到问题如何求助

A:可以将audio下相应logid的所有音频及log/mrcp_debug.log日志文件发送至bsic-support@baidu.com。

DEMO 及 SDK问题反馈

  1. SDK及DEMO BUG反馈格式:
  2. 现象描述 调用我们的xxx方法之后,报错。
  3. 输入参数:(DEMO中含有“反馈”两个字的日志)
  4. 输出结果:
  5. 音频文件: 通过OUT_FILE参数获取录音音频;
  6. 用户日志:先清空日志,之后调用我们的某个方法结束。请提供给我们之中的完整日志。
  7. 手机信息: 手机型号, android、ios版本号等信息

问题反馈及商务沟通请联系:

邮箱:bsic-support@baidu.com

上一篇
私有化部署方式
下一篇
相关协议
什么是法西斯主义 乳腺结节摸着什么感觉 突然戒烟对身体有什么影响 尿有臭味是什么原因 墨菲定律讲的是什么
新生儿前面头发稀少是什么原因 53岁属什么 正财透干是什么意思 疫苗是什么 红楼梦为什么叫石头记
小孩子手足口病有什么症状图片 他克莫司是什么药 李子什么人不能吃 小孩上户口需要什么材料 人体缺甲是什么症状
三焦热盛是什么意思 健康证要带什么 左卵巢内囊性结构什么意思 木姜子什么味道 3月31号什么星座
涤纶是什么材质hcv9jop5ns8r.cn 什么是斜率youbangsi.com 梦见煎鱼是什么预兆hcv9jop0ns3r.cn 血压低挂什么科hcv9jop6ns4r.cn 属猴与什么属相最配hcv9jop3ns1r.cn
脾虚吃什么药效果最好hcv9jop5ns0r.cn 半身不遂是什么原因引起的hcv7jop6ns3r.cn 高密度脂蛋白低是什么原因hcv8jop3ns1r.cn 国家一级演员是什么级别hcv8jop5ns8r.cn 高碳钻是什么bfb118.com
黑京念什么hcv9jop6ns6r.cn 余沧海为什么是两个人hcv8jop2ns6r.cn 生蛇是什么病hcv7jop6ns0r.cn 薄荷叶晒干后能干什么hcv7jop9ns3r.cn 什么呼什么应hcv9jop3ns4r.cn
四月23日是什么星座hcv8jop5ns9r.cn 纯阳之人有什么特征hcv7jop5ns4r.cn 痱子什么样hcv9jop5ns2r.cn 尿路感染要吃什么药hcv8jop6ns3r.cn 脾囊肿是什么原因引起的hcv7jop6ns7r.cn
百度