aip

基于百度AI文字识别系列

牧云@^-^@ 提交于 2020-02-07 10:19:11
About 百度AI平台有丰富的接口供我们调用,包括人脸识别、文字识别、语音识别等,非常的方便。 想要使用该平台,首先要有一个百度账号,然后进入 百度IA开放平台 ,创建相应的应用: 进入文字识别,这时可能会提示你登录,登录完事后,进入自己的控制台,选择文字识别,然后创建应用,应用名和描述视情况填写。然后记住下图中的相关参数,后续会用到。 通用文字识别 首先要下载包: pip install baidu-aip 图片: 代码: from aip import AipOcr def initial(): """ 初始化连接 """ APP_ID = '你的 App ID' API_KEY = '你的 Api Key' SECRET_KEY = '你的 Secret Key' return AipOcr(APP_ID, API_KEY, SECRET_KEY) def get_file_content(filePath): """ 读取图片 """ with open(filePath, 'rb') as f: return f.read() if __name__ == '__main__': client = initial() image = get_file_content('img3.png') res1 = client.basicGeneral(image) #

图片文字识别

烂漫一生 提交于 2020-01-28 12:18:21
图片文字识别 又是一个有趣的小项目,而且很实用,相信大家都用过QQ里的图片转文字功能,而这就是电脑端的图片转文字。 项目代码是照搬的一篇博文,不做赘述,链接如下 点击直达 友情提示( 本次项目所导入的 AIP 模块包名应为 baidu-aip ) 上效果图: 供识别的截图 识别结果如下 在此记录一下收获: 百度AI开放平台有许多API供调用,便于后续实现更多有趣的项目 同时提供SDK资源,Software Development Kit(软件开发工具包),可用于移动应用开发 keyboard模块,PIL模块,time模块 来源: CSDN 作者: yc10d 链接: https://blog.csdn.net/yc10d/article/details/103820707

基于百度OCR的图片文字识别

冷暖自知 提交于 2020-01-11 00:19:04
   先上图,有图有真相   首先在百度开通ORC服务,目前是免费的,普通识别每天50000次免费,非常棒! 百度文档: http://ai.baidu.com/docs#/OCR-API/top   下载百度SDK神马的就不多说了,需要包含CURL和JSON库,注意版本要求   windows下的openssl 32位和64位一键安装包顺便分享下,自己安装太麻烦   链接:https://pan.baidu.com/s/1HAuplB3deQGFk2eO8zC13A   提取码:mh34   CURL和JSON库就不贴出来了,网上随便都能找到,需要的朋友可以找我,我私发给你。   接下来进入正题,贴代码: ImageRecogition.h 1 #pragma once 2 3 #include "json/json.h" 4 5 class CImageRecogition 6 { 7 public: 8 CImageRecogition(); 9 ~CImageRecogition(); 10 11 public: 12 /*accurate_basic*/ 13 Json::Value static accurate_basic(std::string szFile); 14 /*general_basic*/ 15 Json::Value static general

getaddrinfo函数详解

99封情书 提交于 2019-12-05 07:09:08
有这样一个C/S程序,server提供一个叫做ruptime的服务,功能是当有客户端连接时调用uptime程序,并将结果发送到client。可是现在的问题是,这个服务系统本来是没有的,所以调用getaddrinfo的时候会返回如下错误: 代码: Servname not supported for ai_socktype 我觉得可能是需要编辑/etc/service文件把自己这个服务加进去,可是我加了之后没管用(设的端口是4000),开机的时候提示启动服务失败,所以我的问题就是如何开启我这个服务器程序提供的服务 个人认为,这个问题就是对getaddrinfo函数的应用和理解,下面帖子的内容基本上是对Advanced Programming in linux Environment这本书里的16-6等几个程序的解释,刚开始对getaddrinfo这 个函数和编辑/etc/service等不了解,所会有以上的问题存在。下面是资料。 bumpy:~/tmp$ gcc a.c bumpy:~/tmp$ ./a.out <==== 没有改/etc/services 前 getaddrinfo error: Servname not supported for ai_socktype bumpy:~/tmp$ vi a.c bumpy:~/tmp$ sudo vi /etc/services

海思HI35xx语音识别方案

狂风中的少年 提交于 2019-12-01 21:34:30
前言 语音识别是智能化应用的一个重要分支,也是语音交互功能的基础。语音识别基于神经网络算法,借助大数据进行模型训练,据科大讯飞相关数据报道,它们已经能够实现98%以上的准确识别率,同时支持多种外语及国内的一些方言。从语音技术实现方式分类可以分为本地识别和云识别,本地识别主要是借助语音芯片诸如LD3320等,而云识别目前国内比较火的有科大讯飞、百度AI等云服务提供,它们提供友好的API接口,支持多种开发语言,相比于本地语音识别,它的识别准确率更高,应用场景更为灵活。 海思HI35xx音频知识 海思音频模块包含音频输入(AI)、音频输出(AO)、音频编码(AENC)、音频解码(ADEC)这四个模块,这几个模块实现了声音采集、声音播放以及声音编解码的功能。原始的音频信号是模拟信号,通过pcm方式进行数字化,常用音频采样频率有8khz、16khz、32khz、48khz。根据香农采样定理, 为了不失真地恢复模拟信号,采样频率应该不小于模拟信号频谱中最高频率的 2 倍 ,而人能听到的声音频率范围在 20~20000hz ,而且听力敏感区是集中在中频区段,所以用 16khz 频率采样作为语音识别原始数据既能保持音质,也能降低数据运算复杂度。 根据笔者的经验,海思音频模块硬件实现方式有两种,一种是将音频芯片集成到芯片内部,作为片上资源使用,另一种是外接音频芯片方式,如wm9874

会议信息|CNKI|AIAA|万方|AIP|CNKI|EI|CPCI|BP|INSPEC

耗尽温柔 提交于 2019-12-01 13:31:58
会议论文: 学术文献的三大支柱是期刊、专利和学位论文。会议论文是新的所以发文章快,灰色的,有些只有摘要,所以不容易获取。 有以下二次文献数据库,仅有摘要: CPCI BP :生物医学类 INSPEC 在 Wos 中: CNKI :国家二级会议以上 EI 全文数据库: 万方 &CNKI&AIAA& AIP : 查询会议日程信息: CNKI : 国际会议: 来源: https://www.cnblogs.com/yuanjingnan/p/11688557.html