实拍是什么意思| 什么是慰安妇| 爸爸的外婆叫什么| 三严三实是什么| 手痒脱皮是什么原因| 空调健康模式是什么意思| 尿酸高会引起什么疾病| 好色是什么意思| 917是什么意思| 放疗和化疗有什么区别| 耳朵嗡嗡响什么原因| 斗战胜佛是什么意思| 大夫是什么官职| ssr是什么意思| 尿道感染吃什么药最好| pubg什么意思| 女性内分泌失调有什么症状| 鬼畜什么意思| 今年23岁属什么生肖| 男生为什么喜欢女生叫爸爸| 怀孕吃叶酸有什么用| 大手牵小手是什么菜| 穷极一生是什么意思| 百脚虫的出现意味什么| 风团是什么| 身上痒但是什么都没有| 虾皮是什么| 海马是什么类动物| 为什么会晕3d| 泰国的钱叫什么| 惊弓之鸟是什么意思| 史无前例是什么意思| 股骨头坏死什么症状| 阿是什么意思| 痛苦是什么意思| 水痘长什么样| 惊悸的意思是什么| 九肚鱼是什么鱼| 大肠在人体什么位置图| 十一是什么意思| 什么的流淌| aoa是什么意思| 七年是什么婚| 五光十色是什么生肖| 正在值机是什么意思| 僵尸是什么意思| 乙肝两对半定量是什么意思| 菖蒲是什么| 水逆退散是什么意思| 浮瓜沉李什么意思| 射精出血吃什么药最好| 一吃饭就吐是什么原因| 看男性性功能挂什么科| 天伦之乐什么意思| 血余炭是什么制成的| 白内障吃什么药| 左眼皮跳是什么预兆| 鸳鸯是什么意思| 遮挡车牌属于什么行为| 下连是什么意思| 兰桂齐芳是什么意思| 吃百香果有什么好处| 抗体弱阳性是什么意思| 一什么教室| 血压高是什么症状| 处暑是什么意思| 点到为止是什么意思| 孕妇血糖高可以吃什么水果| 鹞是什么意思| 凝血四项能查出什么病| 舌吻有什么好处| 双子座男和什么座最配对| 射手属于什么象星座| 囊腺瘤是什么| 止境是什么意思| 10月份什么星座| 肺部肿瘤吃什么好| 印度什么人种| 身份证末尾x代表什么| 人山人海是什么生肖| 什么叫肾病综合征| 胆囊炎要吃什么药| 外感发热什么意思| 送朋友什么礼物好| 心境障碍是什么病| 打羽毛球有什么好处| 宸字属于五行属什么| 金蝉脱壳比喻什么| 先考是什么意思| 脚气用什么药膏效果好| 驱除鞑虏是什么意思| 新生儿什么时候上户口| 女人不排卵是什么原因造成的| 痛风不能吃什么东西| 脂蛋白高是什么原因| 盲从什么意思| 什么首什么胸| 心率低于60说明什么| 胃肠外科是看什么病的| noah是什么牌子| 什么是手机号| 什么叫蛇胆疮| psp是什么意思| 乳腺纤维瘤和乳腺结节有什么区别| 秋天吃什么| 调理神经吃什么药好| 圣诞节的礼物什么时候送| 3月3日什么星座| 左下腹疼痛是什么原因| 眼震是什么症状| 植入是什么意思| 喝什么养肝护肝| 什么是平年什么是闰年| mar是什么意思| 腋下臭是什么原因| 查电话号码打什么电话| 红细胞高是什么原因| 黄芪精适合什么人喝| hb是什么意思医学| 灰指甲长什么样子图片| 中国第一大姓是什么| 比重是什么意思| 鼻子出油多是什么原因| 什么动物三只爪| egc是什么意思| 被蟑螂咬了擦什么药| ghost是什么意思| 子宫内膜手术后需要注意什么| 灌肠什么意思| 女性尿浑浊是什么原因| 肝区回声密集是什么意思| 口且念什么| 精液什么颜色| 睡觉出汗多是什么原因| 无痛人流后吃什么对身体恢复比较好| 边什么边什么| venes保温杯是什么品牌| 灌肠是什么意思| 女性吃金蝉有什么好处| 团粉是什么| 引力是什么| 醛固酮高有什么危害| 盆底肌高张是什么意思| 疼风是什么原因引起的| hbsag是什么| ua是什么| 脸部痤疮用什么药| 石榴什么时候成熟| 肾结石什么原因引起的| 换药挂什么科| 什么是ct| 檀木手串有什么好处| 如是什么意思| 为什么正骨后几天越来越疼| 猴子怕什么| 碳酸钙d3颗粒什么时候吃最好| 呓语是什么意思| 弦脉是什么意思| 淋巴滤泡增生是什么意思严重吗| 乳腺看什么科| 什么能力| fda是什么意思| 早搏是什么症状| 宫颈肥大有什么症状| 八月17号是什么星座的| 低压偏高有什么危害| 微信拉黑和删除有什么区别| 总胆固醇高是什么原因| 鲫鱼不能和什么一起吃| 乙肝五项第二项阳性是什么意思| 坐位体前屈是什么| 润字五行属什么| 泌尿系彩超主要是检查什么| 鸡蛋为什么不能放冰箱| 泰坦尼克号什么时候上映的| 苏慧伦为什么不老| 月经前乳房胀痛是什么原因| 玩微博的都是什么人| 海竹是什么| 宝宝头发黄是缺什么| 放量十字星是什么意思| 湄公鱼是什么鱼| 暗经是什么意思| 最毒妇人心是什么意思| 什么原因引起耳石症| 陶和瓷有什么区别| 圆寂是什么意思| 尾骨疼是什么原因| 五大三粗是什么意思| 长期便秘是什么原因| 染发有什么危害| 头晕用什么药| 肺结节吃什么药| 睡醒后口苦是什么原因| 什么叫留守儿童| 颈椎脑供血不足吃什么药| 无国界医生是什么意思| society是什么意思| 彩头是什么意思| 梦见酒是什么意思| 什么头什么臂| q10什么时候吃最好| 丹桂飘香是什么季节| 终止妊娠是什么意思| 小腹痛是什么原因| 为什么会血压高| 功能是什么意思| 蛆是什么| 嗔是什么意思| 腿麻木是什么原因引起的| 腮腺炎的症状是什么| 爱放屁吃什么药| 血小板少是什么病| 相濡以沫是什么意思| 低级别上皮内瘤变是什么意思| 梦见买鸡蛋是什么意思周公解梦| 四风指什么| 大便干吃什么药| 洗牙有什么危害吗| 杜甫被后人称为什么| 抽血化验能查出什么| 人为什么会得肿瘤| prc是什么| 由可以组什么词| 缺钾有什么表现和症状| 色令智昏是什么意思| 茯苓是什么| 秀才相当于什么学历| 金族念什么| 气血两亏是什么意思| 六月初一有什么讲究| 痤疮用什么药膏最有效| 十指纤纤尽夸巧是什么生肖| 印度为什么那么热| 脂蛋白a是什么意思| 古代上元节是什么节日| 马桶为什么会堵| 11.22是什么星座| 马齿苋长什么样子| 腿肿吃什么药| 老是口渴是什么原因| 肺心病吃什么药| 黄体是什么意思| 医生和医师有什么区别| 飞蚊症吃什么药| 你为什么背着我爱别人| 老年人适合喝什么牛奶| 857是什么意思| 反流性咽喉炎吃什么药| 养阴生津是什么意思| 粉底和气垫的区别是什么| 肺部有空洞是什么病症| 鲁迅是著名的什么家| 周传雄得了什么病| 宣发是什么意思| 扁桃体为什么会发炎| 醋酸是什么| 尿路感染吃什么药效果最好| 肾结石喝酒有什么影响| 么么哒什么意思| 蘑菇炒什么好吃| 很容易出汗是什么原因| 网约车是什么意思| 临产是什么意思| 百度
资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

【网络媒体走转改】刘富琴:“圆梦爱心驿站”带来爱和温暖

Python SDK文档

简介

Hi,您好,欢迎使用百度自然语言处理服务。

本文档主要针对Python开发者,描述百度自然语言处理接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

接口能力

接口名称 接口能力简要描述
词法分析 分词、词性标注、专名识别
短文本相似度 判断两个文本的相似度得分
评论观点抽取 提取一个句子观点评论的情感属性
情感倾向分析 对包含主观观点信息的文本进行情感极性类别(积极、消极、中性)的判断,并给出相应的置信度
文章标签 分析文章的标题和内容,输出能够反映文章关键信息的主题、话题、实体等多维度标签以及对应的置信度
文章分类 根据文章内容类型,对文章进行自动分类
文本纠错 识别文本中有错误的片段,进行错误提示并给出正确的建议文本内容
对话情绪识别 针对用户日常沟通文本背后所蕴含情绪的一种直观检测,可自动识别出当前会话者所表现出的情绪类别及其置信度
新闻摘要 自动抽取新闻文本中的关键信息,进而生成指定长度的新闻摘要
地址识别 精准提取快递填单文本中的姓名、电话、地址信息,自动补充和纠正,生成结构化信息

版本更新记录

上线日期 版本号 更新内容
2021.03.23 4.15.7 bug修改,接口升级
2019.12.19 2.2.19 新增地址识别
2018.12.7 2.2.10 新增新闻摘要接口
2018.6.15 2.2.5 新增文本纠错,情感识别接口
2018.01.25 2.2.0 新增文本标签API
2017.12.22 2.0.0 SDK代码重构
2017.05.11 1.0.0 自然语言处理服务上线

快速入门

安装自然语言处理 Python SDK

自然语言处理 Python SDK目录结构

├── README.md
├── aip                   //SDK目录
│   ├── __init__.py       //导出类
│   ├── base.py           //aip基类
│   ├── http.py           //http请求
│   └── nlp.py //自然语言处理
└── setup.py              //setuptools安装

支持Python版本:2.7.+ ,3.+

安装使用Python SDK有如下方式

  • 可在官网下载最新版本。
  • 如果已安装pip,执行pip install baidu-aip即可,如果需要使用HTTP2,请安装pip install baidu-aip-http2
  • 如果已安装setuptools,执行python setup.py install即可。

新建AipNlp

AipNlp是自然语言处理的Python SDK客户端,为使用自然语言处理的开发人员提供了一系列的交互方法。

参考如下代码新建一个AipNlp:

from aip import AipNlp

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipNlp(APP_ID, API_KEY, SECRET_KEY)

在上面代码中,常量APP_ID在百度云控制台中创建,常量API_KEYSECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。

注意:如您以前是百度云的老用户,其中API_KEY对应百度云的“Access Key ID”,SECRET_KEY对应百度云的“Access Key Secret”。

配置AipNlp

如果用户需要配置AipNlp的网络请求参数(一般不需要配置),可以在构造AipNlp之后调用接口设置参数,目前只支持以下参数:

接口 说明
setConnectionTimeoutInMillis 建立连接的超时时间(单位:毫秒
setSocketTimeoutInMillis 通过打开的连接传输数据的超时时间(单位:毫秒)

接口说明

词法分析

词法分析接口向用户提供分词、词性标注、专名识别三大功能;能够识别出文本串中的基本词汇(分词),对这些词汇进行重组、标注组合后词汇的词性,并进一步识别出命名实体。

text = "百度是一家高科技公司";
charset="UTF-8"

""" 调用词法分析 """
client.lexer(text);

词法分析 请求参数详情

参数名称 是否必选 类型 说明
text string 待分析文本,长度不超过20000字节
charset string UTF-8

词法分析 返回数据参数详情

参数名称 类型 必需 详细说明
text string 原始单条请求文本
items array(object) 词汇数组,每个元素对应结果中的一个词
+item string 词汇的字符串
+ne string 命名实体类型,命名实体识别算法使用。词性标注算法中,此项为空串
+pos string 词性,词性标注算法使用。命名实体识别算法中,此项为空串
+byte_offset int 在text中的字节级offset(使用GBK编码)
+byte_length int 字节级length(使用GBK编码)
+uri string 链指到知识库的URI,只对命名实体有效。对于非命名实体和链接不到知识库的命名实体,此项为空串
+formal string 词汇的标准化表达,主要针对时间、数字单位,没有归一化表达的,此项为空串
+basic_words array(string) 基本词成分
+loc_details array(object) 地址成分,非必需,仅对地址型命名实体有效,没有地址成分的,此项为空数组。
++type string 成分类型,如省、市、区、县
++byte_offset int 在item中的字节级offset(使用GBK编码)
++byte_length int 字节级length(使用GBK编码)

词法分析 返回示例

{
  "status":0,
  "version":"ver_1_0_1",
  "results":[
    {
      "retcode":0,
      "text":"百度是一家高科技公司",
      "items":[
         {
           "byte_length":4,
           "byte_offset":0,
           "formal":"",
           "item":"百度",
           "ne":"ORG",
           "pos":"",
           "uri":"",
           "loc_details":[ ],
           "basic_words":["百度"]
         },
         {
           "byte_length":2,
           "byte_offset":4,
           "formal":"",
           "item":"是",
           "ne":"",
           "pos":"v",
           "uri":"",
           "loc_details":[ ],
           "basic_words":["是"]
         },
         {
           "byte_length":4,
           "byte_offset":6,
           "formal":"",
           "item":"一家",
           "ne":"",
           "pos":"m",
           "uri":"",
           "loc_details":[ ],
           "basic_words":["一","家"]
         },
         {
           "byte_length":6,
           "byte_offset":10,
           "formal":"",
           "item":"高科技",
           "ne":"",
           "pos":"n",
           "uri":"",
           "loc_details":[ ],
           "basic_words":["高","科技"]
         },
         {
           "byte_length":4,
           "byte_offset":16,
           "formal":"",
           "item":"公司",
           "ne":"",
           "pos":"n",
           "uri":"",
           "loc_details":[ ],
           "basic_words":["公司"]
         }
      ]
    }
  ]
}

词性缩略说明

词性 含义 词性 含义 词性 含义 词性 含义
n 普通名词 f 方位名词 s 处所名词 t 时间名词
nr 人名 ns 地名 nt 机构团体名 nw 作品名
nz 其他专名 v 普通动词 vd 动副词 vn 名动词
a 形容词 ad 副形词 an 名形词 d 副词
m 数量词 q 量词 r 代词 p 介词
c 连词 u 助词 xc 其他虚词 w 标点符号

专名识别缩略词含义

缩略词 含义 缩略词 含义 缩略词 含义 缩略词 含义
PER 人名 LOC 地名 ORG 机构名 TIME 时间

词法分析(定制版)

词法分析接口向用户提供分词、词性标注、专名识别三大功能;能够识别出文本串中的基本词汇(分词),对这些词汇进行重组、标注组合后词汇的词性,并进一步识别出命名实体。

text = "百度是一家高科技公司"

""" 调用词法分析(定制版) """
client.lexerCustom(text);

词法分析(定制版) 请求参数详情

参数名称 是否必选 类型 说明
text string 待分析文本(目前仅支持GBK编码),长度不超过20000字节

词法分析(定制版) 返回数据参数详情

参数名称 类型 必需 详细说明
text string 原始单条请求文本
items array(object) 词汇数组,每个元素对应结果中的一个词
+item string 词汇的字符串
+ne string 命名实体类型,命名实体识别算法使用。词性标注算法中,此项为空串
+pos string 词性,词性标注算法使用。命名实体识别算法中,此项为空串
+byte_offset int 在text中的字节级offset(使用GBK编码)
+byte_length int 字节级length(使用GBK编码)
+uri string 链指到知识库的URI,只对命名实体有效。对于非命名实体和链接不到知识库的命名实体,此项为空串
+formal string 词汇的标准化表达,主要针对时间、数字单位,没有归一化表达的,此项为空串
+basic_words array(string) 基本词成分
+loc_details array(object) 地址成分,非必需,仅对地址型命名实体有效,没有地址成分的,此项为空数组。
++type string 成分类型,如省、市、区、县
++byte_offset int 在item中的字节级offset(使用GBK编码)
++byte_length int 字节级length(使用GBK编码)

词法分析(定制版) 返回示例

参考词法分析接口

短文本相似度

短文本相似度接口用来判断两个文本的相似度得分。

text1 = "浙富股份"

text2 = "万事通自考网"

""" 调用短文本相似度 """
client.simnet(text1, text2);

""" 如果有可选参数 """
options = {}
options["model"] = "CNN"

""" 带参数调用短文本相似度 """
client.simnet(text1, text2, options)

短文本相似度 请求参数详情

参数名称 是否必选 类型 描述
text_1 string 待比较文本1,最大512字节
text_2 string 待比较文本2,最大512字节
model string 默认为"ERNIE"

短文本相似度 返回数据参数详情

参数 类型 描述
log_id number 请求唯一标识
score number 两个文本相似度得分
texts array 输入文本
+text_1 string 第一个短文本
+text_2 string 第二个短文本

短文本相似度 返回示例

{
    "log_id": 12345,
    "texts":{
        "text_1":"浙富股份",
        "text_2":"万事通自考网"
    },
    "score":0.3300237655639648 //相似度结果
},

评论观点抽取

评论观点抽取接口用来提取一条评论句子的关注点和评论观点,并输出评论观点标签及评论观点极性。

text = "三星电脑电池不给力"

""" 调用评论观点抽取 """
client.commentTag(text);

""" 如果有可选参数 """
options = {}
options["type"] = 13

""" 带参数调用评论观点抽取 """
client.commentTag(text, options)

评论观点抽取 请求参数详情

参数名称 是否必选 类型 可选值范围 说明
text string 评论内容(GBK编码),最大10240字节
type string 1 - 酒店
2 - KTV3 - 丽人
4 - 美食餐饮
5 - 旅游
6 - 健康
7 - 教育
8 - 商业
9 - 房产
10 - 汽车
11 - 生活
12 - 购物
13 - 3C
评论行业类型,默认为4(餐饮美食)

评论观点抽取 返回数据参数详情

参数 类型 描述
log_id uint64 请求唯一标识码
prop string 匹配上的属性词
adj string 匹配上的描述词
sentiment int 该情感搭配的极性(0表示消极,1表示中性,2表示积极)
begin_pos int 该情感搭配在句子中的开始位置
end_pos int 该情感搭配在句子中的结束位置
abstract string 对应于该情感搭配的短句摘要

评论观点抽取 返回示例

{
    "items": [
        {
        "prop":"电池",
        "adj": "不给力",
        "sentiment": 0,
        "begin_pos": 8,
        "end_pos": 18,
        "abstract":"三星电脑<span>电池不给力</span>"
        }
    ]
}

情感倾向分析

对包含主观观点信息的文本进行情感极性类别(积极、消极、中性)的判断,并给出相应的置信度。

text = "苹果是一家伟大的公司"

""" 调用情感倾向分析 """
client.sentimentClassify(text);

情感倾向分析 请求参数详情

参数名称 是否必选 类型 说明
text string 文本内容(GBK编码),最大2048字节

情感倾向分析 返回数据参数详情

参数 是否必须 类型 说明
text string 输入的文本内容
items array 输入的词列表
+sentiment number 表示情感极性分类结果, 0:负向,1:中性,2:正向
+confidence number 表示分类的置信度
+positive_prob number 表示属于积极类别的概率
+negative_prob number 表示属于消极类别的概率

情感倾向分析 返回示例

{
    "text":"苹果是一家伟大的公司",
    "items":[
        {
            "sentiment":2,    //表示情感极性分类结果
            "confidence":0.40, //表示分类的置信度
            "positive_prob":0.73, //表示属于积极类别的概率
            "negative_prob":0.27  //表示属于消极类别的概率
        }
    ]
}

文章标签

文章标签服务能够针对网络各类媒体文章进行快速的内容理解,根据输入含有标题的文章,输出多个内容标签以及对应的置信度,用于个性化推荐、相似文章聚合、文本内容分析等场景。

title = "iphone手机出现“白苹果”原因及解决办法,用苹果手机的可以看下"

content = "如果下面的方法还是没有解决你的问题建议来我们门店看下成都市锦江区红星路三段99号银石广场24层01室。"

""" 调用文章标签 """
client.keyword(title, content);

文章标签 请求参数详情

参数名称 是否必选 类型 说明
title string 篇章的标题,最大80字节
content string 篇章的正文,最大65535字节

文章标签 返回数据参数详情

参数 是否必须 类型 说明
items array(object) 关键词结果数组,每个元素对应抽取到的一个关键词
+tag string 关注点字符串
+score number 权重(取值范围0~1)

文章标签 返回示例

{
    "log_id": 4457308639853058292,
    "items": [
        {
            "score": 0.997762,
            "tag": "iphone"
        },
        {
            "score": 0.861775,
            "tag": "手机"
        },
        {
            "score": 0.845657,
            "tag": "苹果"
        },
        {
            "score": 0.83649,
            "tag": "苹果公司"
        },
        {
            "score": 0.797243,
            "tag": "数码"
        }
    ]
}

文章分类

对文章按照内容类型进行自动分类,首批支持娱乐、体育、科技等26个主流内容类型,为文章聚类、文本内容分析等应用提供基础技术支持。

title = "欧洲冠军杯足球赛"

content = "欧洲冠军联赛是欧洲足球协会联盟主办的年度足球比赛,代表欧洲俱乐部足球最高荣誉和水平,被认为是全世界最高素质、最具影响力以及最高水平的俱乐部赛事,亦是世界上奖金最高的足球赛事和体育赛事之一。"

""" 调用文章分类 """
client.topic(title, content);

文章分类 请求参数详情

参数名称 是否必选 类型 说明
title string 篇章的标题,最大80字节
content string 篇章的正文,最大65535字节

文章分类 返回数据参数详情

参数名称 类型 详细说明
item object 分类结果,包含一级与二级分类
+lv1_tag_list array of objects 一级分类结果
+lv2_tag_list array of objects 二级分类结果
++score float 类别标签对应得分,范围0-1
++tag string 类别标签

文章分类 返回示例

{
    "log_id": 5710764909216517248,
    "item": {
        "lv2_tag_list": [
            {
                "score": 0.895467,
                "tag": "足球"
            },
            {
                "score": 0.794878,
                "tag": "国际足球"
            }
        ],
        "lv1_tag_list": [
            {
                "score": 0.88808,
                "tag": "体育"
            }
        ]
    }
}

文本纠错

识别输入文本中有错误的片段,提示错误并给出正确的文本结果。支持短文本、长文本、语音等内容的错误识别,纠错是搜索引擎、语音识别、内容审查等功能更好运行的基础模块之一。

text = "百度是一家人工只能公司"

""" 调用文本纠错 """
client.ecnet(text);

文本纠错 请求参数详情

参数名称 是否必选 类型 说明
text string 待纠错文本,输入限制511字节

文本纠错 返回数据参数详情

参数 说明 描述
log_id uint64 请求唯一标识码
correct_query string 纠错后的文本
score double 模型置信度打分
item object 分析结果
+vec_fragment list 替换候选片段信息
++ori_frag string 原片段
++correct_frag double 替换片段
++begin_pos int 起始(长度单位)
++end_pos list 结尾(长度单位)

文本纠错 返回示例

{
    "log_id": 6770395607901559829,
    "item": {
        "vec_fragment": [
            {
                "ori_frag": "只能",
                "begin_pos": 21,
                "correct_frag": "智能",
                "end_pos": 27
            }
        ],
        "score": 0.875169,
        "correct_query": "百度是一家人工智能公司"
    },
    "text": "百度是一家人工只能公司"
}

对话情绪识别接口

针对用户日常沟通文本背后所蕴含情绪的一种直观检测,可自动识别出当前会话者所表现出的情绪类别及其置信度,可以帮助企业更全面地把握产品服务质量、监控客户服务质量

text = "本来今天高高兴兴"

""" 调用对话情绪识别接口 """
client.emotion(text);

""" 如果有可选参数 """
options = {}
options["scene"] = "talk"

""" 带参数调用对话情绪识别接口 """
client.emotion(text, options)

对话情绪识别接口 请求参数详情

参数名称 是否必选 类型 说明
text string 待识别情感文本,输入限制512字节
scene string default(默认项-不区分场景),talk(闲聊对话-如度秘聊天等),task(任务型对话-如导航对话等),customer_service(客服对话-如电信/银行客服等)

对话情绪识别接口 返回数据参数详情

参数 说明 描述
log_id uint64 请求唯一标识码
text string 输入的对话文本内容
items list 分析结果数组
++label string 情绪分类标签;pessimistic(负向情绪)、neutral(中性情绪)、optimistic(正向情绪)
++prob double item标签对应的概率

对话情绪识别接口 返回示例

{
    "log_id": 4258005459150262970,
    "text": "本来今天高高兴兴",
    "items": [
        {
            "prob": 0.998619,
            "label": "neutral"
        },
        {
            "prob": 0.00138141,
            "label": "pessimistic"
        },
    ]
}

新闻摘要接口

自动抽取新闻文本中的关键信息,进而生成指定长度的新闻摘要

content = "麻省理工学院的研究团队为无人机在仓库中使用RFID技术进行库存查找等工作,创造了一种..."

maxSummaryLen = 300

""" 调用新闻摘要接口 """
client.newsSummary(content, maxSummaryLen);

""" 如果有可选参数 """
options = {}
options["title"] = "标题"

""" 带参数调用新闻摘要接口 """
client.newsSummary(content, maxSummaryLen, options)

新闻摘要接口 请求参数详情

参数名称 是否必选 类型 说明
content string 字符串(限3000字符数以内)字符串仅支持GBK编码,长度需小于3000字符数(即6000字节),请输入前确认字符数没有超限,若字符数超长会返回错误。正文中如果包含段落信息,请使用"\n"分隔,段落信息算法中有重要的作用,请尽量保留
max_summary_len integer 此数值将作为摘要结果的最大长度。例如:原文长度1000字,本参数设置为150,则摘要结果的最大长度是150字;推荐最优区间:200-500字
title string 字符串(限200字符数)字符串仅支持GBK编码,长度需小于200字符数(即400字节),请输入前确认字符数没有超限,若字符数超长会返回错误。标题在算法中具有重要的作用,若文章确无标题,输入参数的“标题”字段为空即可

新闻摘要接口 返回数据参数详情

参数 说明 描述
log_id uint64 请求唯一标识码
summary string 摘要结果

新闻摘要接口 返回示例

{
    "log_id": 4258005459150262970,
    "summary": "麻省理工学院的研究团队为无人机在仓库中使用RFID技术进行库存查找等工作,创造了一种聪明的新方式。使用RFID标签更换仓库中的条形码,将帮助提升自动化并提高库存管理的准确性。几家公司已经解决了无人机读取RFID的技术问题。麻省理工学院的新解决方案,名为Rfly,允许无人机阅读RFID标签,而不用捆绑巨型读卡器。无人机接收从远程RFID读取器发送的信号,然后转发它读取附近的标签。"
}

地址识别接口

针对快递、电商行业中客户在线提交的大量非结构化地址单据,该接口可以帮助精准提取快递填单文本中的姓名、电话、地址信息,通过自然语言处理辅助地址识别做自动补充和纠正,生成标准规范的结构化信息,大幅提升企业处理单据的效率。

text = "上海市浦东新区纳贤路701号百度上海研发中心 F4A000 张三"

""" 调用地址识别接口 """
client.address(text);

地址识别接口 请求参数详情

参数名称 是否必选 类型 说明
text string 待识别的文本内容,不超过1000字节

地址识别接口 返回数据参数详情

参数 说明 描述
log_id uint64 请求唯一标识码
text string 原始输入的文本内容
province string 省(直辖市/自治区)
province_code string 省国标code
city string
city_code string 城市国标code
county string 区(县)
county_code string 区县国标code
town string 街道(乡/镇)
town_code string 街道/乡镇国标code
person string 姓名,如果出现多个则按顺序输出
detail string 详细地址
phonenum string 电话号码,如果出现多个则按顺序输出

地址识别接口 返回示例

{
    "province": "上海市",
    "city": "上海市",
    "province_code": "310000",
    "log_id": 1420038644986026316,
    "text": "上海市浦东新区纳贤路701号百度上海研发中心 F4A000 张三",
    "town": "张江镇",
    "phonenum": "",
    "detail": "纳贤路701号百度上海研发中心F4A000",
    "county": "浦东新区",
    "person": "张三",
    "town_code": "310115125",
    "county_code": "310115",
    "city_code": "310100"
}

错误信息

错误返回格式

若请求错误,服务器将返回的JSON文本包含以下参数:

  • error_code:错误码。
  • error_msg:错误描述信息,帮助理解和解决发生的错误。

错误码

错误码 错误信息 描述
1 Unknown error 服务器内部错误,请再次请求, 如果持续出现此类错误,请通过QQ群(860337848)或提交工单联系技术支持团队。
2 Service temporarily unavailable 服务暂不可用,请再次请求, 如果持续出现此类错误,请通过QQ群(860337848)或提交工单联系技术支持团队。
3 Unsupported openapi method 调用的API不存在,请检查请求URL后重新尝试,一般为URL中有非英文字符,如“-”,可手动输入重试
4 Open api request limit reached 集群超限额,请再次请求, 如果持续出现此类错误,请通过QQ群(860337848)或提交工单联系技术支持团队。
6 No permission to access data 无权限访问该用户数据,创建应用时未勾选相关接口
13 Get service token failed 获取token失败
14 IAM Certification failed IAM 鉴权失败
15 app not exsits or create failed 应用不存在或者创建失败
17 Open api daily request limit reached 每天请求量超限额,可通过QQ群(860337848)联系群管、提交工单提升限额
18 Open api qps request limit reached QPS超限额,可通过QQ群(860337848)联系群管、提交工单提升限额
19 Open api total request limit reached 请求总量超限额,可通过QQ群(860337848)联系群管、提交工单提升限额
100 Invalid parameter 无效的access_token参数,请检查后重新尝试
110 Access token invalid or no longer valid access_token无效
111 Access token expired access token过期
282000 internal error 服务器内部错误,请再次请求, 如果持续出现此类错误,请通过QQ群(632426386)或工单联系技术支持团队。
282002 input encoding error 编码错误,请使用GBK编码
282004 invalid parameter(s) 请求中包含非法参数,请检查后重新尝试
282130 no result 当前查询无结果返回,出现此问题的原因一般为:参数配置存在问题,请检查后重新尝试
282131 input text too long 输入长度超限,请查看文档说明
282133 param {参数名} not exist 接口参数缺失
282300 word error word不在算法词典中
282301 word_1 error word_1提交的词汇暂未收录,无法比对相似度
282302 word_2 error word_2提交的词汇暂未收录,无法比对相似度
282303 word_1&word_2 error word_1和word_2暂未收录,无法比对相似度
上一篇
API参考
下一篇
NLP-Java-SDK
四维和大排畸有什么区别 手足癣用什么药最好 毕是什么意思 脚掌疼是什么原因 吸血鬼怕什么
516是什么意思 子宫直肠凹积液是什么意思 ca125是什么意思 灵芝孢子粉有什么作用 丑是什么库
黄精有什么作用和功效 什么叫三观不正 甲状腺炎吃什么药好得快 三月四号什么星座 糖尿病可以吃什么肉
酒糟鼻买什么药膏去红 吃什么最补肾 捡什么废品最值钱 喝杨梅酒对身体有什么好处 犯病是什么意思
梦见好多猪肉是什么意思hcv9jop2ns8r.cn 七月半是什么节日hcv8jop0ns6r.cn 甲状腺是什么部位hcv8jop7ns4r.cn 正月初十是什么星座hcv8jop5ns3r.cn 浑浑噩噩是什么意思hcv7jop4ns8r.cn
神灵是什么意思hcv8jop6ns1r.cn 秀气是什么意思hcv9jop4ns6r.cn 黛力新主治什么病hcv8jop5ns7r.cn 九八年属什么生肖travellingsim.com 痞块是什么意思hcv9jop4ns4r.cn
蜈蚣进家有什么预兆hcv8jop7ns6r.cn 马六甲板材是什么木材hcv8jop4ns0r.cn 榴莲什么样的好hcv8jop4ns1r.cn iss是什么意思hcv7jop9ns1r.cn 子宫内膜病变有什么症状hcv9jop3ns9r.cn
降肝火喝什么茶hcv9jop4ns3r.cn 肺结核复发有什么症状hcv8jop0ns4r.cn 眼睛为什么老是流眼泪hcv9jop7ns4r.cn 维生素e有什么作用hcv7jop6ns3r.cn 证悟是什么意思chuanglingweilai.com
百度