aac

AAC---音频重采样

北城以北 提交于 2020-03-01 02:35:49
音频处理中,有时不同的编解码器支持的音频格式不一样,原始采样的音频数据可能没法直接直接为编解码器支持,如FFMPEG编码MP3格式的音频,就要求样本采用AV_SAMPLE_FMT_S16P格式保存。 这就需要对不同的音频格式转换,需要重采样。 1 、如果PCM文件采用交叉存储方式,视频帧的概念可能没什么影响,因为数据都是LRLRLR . . . LR方式; 2 、如果采用平行存储方式,L . . . LR . . . RL . . . LR . . . R , 一帧必须按照指定的数据读取了 , 如MP3读取一帧需要读取 1152 * 2 ( 通道数 ) 个样本,然后前 1152 为左声道,后 1152 为右声道。 代码实现音频重采样 把交叉存储的双声道立体声转换成平行存储的双声道立体声 /******************************************************************************* Copyright (c) wubihe Tech. Co., Ltd. All rights reserved. -------------------------------------------------------------------------------- Date Created: 2014-10-25 Author:

ffmpeg音频格式转换

允我心安 提交于 2020-02-28 00:13:35
打开ffmpeg下bin路径ctrl+鼠标右键,选择在此处打开命令窗口。 1.mp3转pcm ffmpeg.exe -i Cry.mp3 -f s16le -ar 8000 -ac 1 -acodec pcm_s16le Cry_8k.pcm 2.wav转pcm ffmpeg.exe -i “di.wav” -f s16le -ar 8k -ac 1 -acodec pcm_s16le Di.pcm 3.wav转aac ffmpeg.exe -i “01.wav” -ar 8k -ac 1 -acodec aac WiFi_failed.aac 4.mp3转aac ffmpeg.exe -i “test.mp3” -strict experimental -ab 128k -ar 8k -ac 1 -acodec aac -y test.aac 5.m4a转pcm ffmpeg.exe -i demo.m4a -f s16le -ar 16000 -ac 1 -acodec pcm_s16le demo.pcm (f:输出格式 ab:码率 ar:采样率 ac:声道 ar:采样率 ac:通道数) 来源: CSDN 作者: Nomidia 链接: https://blog.csdn.net/bajie7045/article/details/104537739

ffmpeg bitstream filter 种类

风格不统一 提交于 2020-02-26 14:42:03
ffmpeg bitstream filter 种类 例如对h264 aac 进行网络传输时候时候要用到bitstream filter添加描述; 种类有: 2.1 aac_adtstoasc 2.2 av1_metadata 2.3 chomp 2.4 dca_core 2.5 dump_extra 2.6 eac3_core 2.7 extract_extradata 2.8 filter_units 2.9 hapqa_extract 2.10 h264_metadata 2.11 h264_mp4toannexb 2.12 h264_redundant_pps 2.13 hevc_metadata 2.14 hevc_mp4toannexb 2.15 imxdump 2.16 mjpeg2jpeg 2.17 mjpegadump 2.18 mov2textsub 2.19 mp3decomp 2.20 mpeg2_metadata 2.21 mpeg4_unpack_bframes 2.22 noise 2.23 null 2.24 prores_metadata 2.25 remove_extra 2.26 text2movsub 2.27 trace_headers 2.28 truehd_core 2.29 vp9_metadata 2.30 vp9

FFmpeg从入门到出家(FLV文件结构解析)

我是研究僧i 提交于 2020-02-26 12:29:24
FLV(FLASH VIDEO),是一种常用的文件封装格式,目前国内外大部分视频分享网站都是采用的这种格式。其标准定义为《Adobe Flash Video File Format Specification》。RTMP协议也是基于FLV视频格式的。 FLV的文件格式在该规范中已阐述清楚,本章节不再重复描述,而是结合下面的示例具体阐述如何分析FLV文件。 图3. FLV文件结构示例1 图4. FLV文件结构示例2 FLV文件的分析工具有很多,这里给大家推荐FLV Parser这个小软件,通过它可以很容易的看到文件的组成结构。 3.1 文件结构 从整个文件上看,FLV是由Header和File Body组成,如下图所示: 图5. FLV文件总体结构 1.FLV Header - 长度为9,其结构的标准定义参见标准定义见E.2 The FLV header; FLV File Body - 由一连串的PreviousTagSize + Tag构成。previousTagSize是4个字节的数据,表示前一个tag的size。标准定义参见E.3 The FLV File Body。 以图3. FLV文件结构示例1为例分析整体结构: 1.位置0x00000000 - 0x00000008, 共9个字节,为FLV Header,其中: ◦0x00000000 - 0x00000002 :

moviepy简单安装使用

大憨熊 提交于 2020-02-24 20:21:37
建议安装1.0.0版本,高版本保存视频有时会没有声音和会报stdout错误 参考:https://www.zhihu.com/question/268046380/answer/720751739 安装moviepy同时也需要安装 brew install imagemagick brew install ghostscript windows参考:https://zhuanlan.zhihu.com/p/46341173 from moviepy.editor import * v1 = VideoFileClip(r'/Users/lonng/Desktop/151-200/任务200: 关系抽取方法介绍.mp4').subclip(1,20) end1 = TextClip("the end",color='red',fontsize=80).set_duration(v1.duration) final = CompositeVideoClip([v1,end1]) final.write_videofile('01.mp4',audio_codec='aac') 注意,有的mac电脑保存没声音可以换个播放器或者保存时加上audio_codec='aac’字段 来源: CSDN 作者: 初心fly 链接: https://blog.csdn.net/weixin

Decode AAC to PCM format using AVAudioConverter Swift

泪湿孤枕 提交于 2020-02-18 05:20:26
问题 How convert AAC to PCM using AVAudioConverter, AVAudioCompressedBuffer and AVAudioPCMBuffer on Swift? On WWDC 2015, 507 Session was said, that AVAudioConverter can encode and decode PCM buffer, was showed encode example, but wasn't showed examples with decoding. I tried decode, and something doesn't work. I don't know what:( Calls: //buffer - it's AVAudioPCMBuffer from AVAudioInputNode(AVAudioEngine) let aacBuffer = AudioBufferConverter.convertToAAC(from: buffer, error: nil) //has data let

使用librtmp进行H264与AAC直播

…衆ロ難τιáo~ 提交于 2020-02-15 13:26:33
libx264 版本是 128 libfaac 版本是 1.28 1、帧的划分 1.1 H.264 帧 对于 H.264 而言每帧的 界定符 为 00 00 00 01 或者 00 00 01 。 比如下面的 h264 文件片断这就包含三帧数据: 第一帧是 00 00 00 01 67 42 C0 28 DA 01 E0 08 9F 96 10 00 00 03 00 10 00 00 03 01 48 F1 83 2A 第二帧是 00 00 00 01 68 CE 3C 80 第三帧是 00 00 01 06 05 FF FF 5D DC 45 E9 BD E6 D9 48 B7 96 2C D8 20 D9 23 EE EF .. 帧类型有: NAL_SLICE = 1 NAL_SLICE_DPA = 2 NAL_SLICE_DPB = 3 NAL_SLICE_DPC = 4 NAL_SLICE_IDR = 5 NAL_SEI = 6 NAL_SPS = 7 NAL_PPS = 8 NAL_AUD = 9 NAL_FILLER = 12, 我们发送 RTMP 数据时只需要知道四种帧类型,其它类型我都把它规类成非关键帧。分别是 NAL_SPS(7), sps 帧 NAL_PPS(8), pps 帧 NAL_SLICE_IDR(5), 关键帧 NAL_SLICE(1) 非关键帧

AAC编码

生来就可爱ヽ(ⅴ<●) 提交于 2020-02-15 13:25:21
1. 前言 如果说目前H.264是视频CODEC的实际霸主,那么AAC就是音频CODEC的女王。主流的音视频格式都是H.264搭配AAC,无论是非实时的媒体文件还是实时的媒体流。 2. AAC历史 Advanced Audio Coding (AAC) 是一个有损压缩的音频编码集(其实新的编码工具也支持无损)。 其设计目标是替代原有MP3编码标准,在与MP3在相似的码率下希望质量优于MP3。这一目标已达到并且由ISO和IEC标准组织标准化在MPEG-2和MPEG-4中。 AAC已被广泛支持并应用到各种设备和系统中 YouTube, iPhone, iPod, iPad, Nintendo DSi, Nintendo 3DS, iTunes, DivX Plus Web Player and PlayStation 3. It is supported on PlayStation Vita, Wii (with the Photo Channel 1.1 update installed), Sony Walkman MP3 series and later, Android and BlackBerry等等。 1997年,AAC第一次出现在标准MPEG-2 Part 7,(ISO/IEC 13818-7:1997)。和视频CODEC标准类似,AAC在MPEG-2 Part

音视频与直播

走远了吗. 提交于 2020-02-09 00:04:18
音视频与直播 万人直播架构 直播产品种类 泛娱乐化直播 实时互动直播 泛娱乐化直播架构 实时互动直播架构 CDN网络 CDN网络为了解决用户访问网络资源慢而出现的。 为什么访问慢: 访问链路长,比如从中国北部到南部 人为因素,运营商切割,电信用电信,联通用联通 CDN构成 边缘节点:用户从边缘节点上获取数据,让用户访问链路变短 二级节点:主干网节点,主要用于缓存,减轻源站压力 源站:CP(内容供应方)将内容放到源站 CDN网络架构 搭建直播系统 常用工具 ffmpeg webrtc ffplay:播放器 flashplayer:播放rtmp 搭建流媒体服务 准备流媒体服务器 编译并安装 Nginx 服务 配置 RTMP 服务并启动 Nginx 服务 音频知识 声音三要素 音调:就是音频,男生 < 女生 < 儿童 音量:振动的幅度 音色:与材质有很大的关系,本质是谐波 音量与音调 音色(音品) 心里声学原理 人类听觉范围 音频压缩可以只留下可听声波数据 听觉/发生范围 人的正常说话,蝙蝠听不到。 音频量化与编码 音频量化过程 量化基本概念: 采样大小:一个采样用多少个bit存放,常用的是16bit 采样率:采样频率8k、16K、32K、44.1K、48K 声道数:单声道、双声道、多声道 码率计算 一个PCM音频流的码率:采样率 * 采样大小 * 声道数 例如: 采样率为44.1KHz

关于视频的一些概念

南楼画角 提交于 2020-02-05 00:42:18
http://www.samirchen.com/video-concept/ 关于视频的一些概念 2016-01-28 视频相关概念 视频文件格式 文件格式这个概念应该是我们比较熟悉的,比如我们常见的 Word 文档的文件格式是 .doc ,JPG 图片的文件格式是 .jpg 等等。那对于视频来说,我们常见的文件格式则有: .mov 、 .avi 、 .mpg 、 .vob 、 .mkv 、 .rm 、 .rmvb 等等。文件格式通常表现为文件在操作系统上存储时的后缀名,它通常会被操作系统用来与相应的打开程序关联,比如你双击一个 test.doc 文件,系统会调用 Word 去打开它。你双击一个 test.avi 或者 test.mkv 系统会调用视频播放器去打开它。 同样是视频,为什么会有 .mov 、 .avi 、 .mpg 等等这么多种文件格式呢?那是因为它们通过不同的方式实现了视频这件事情,至于这个不同在哪里,那就需要了解一下接下来要说的「视频封装格式」这个概念了。 视频封装格式 视频封装格式,简称视频格式,相当于一种储存视频信息的容器,它里面包含了封装视频文件所需要的视频信息、音频信息和相关的配置信息(比如:视频和音频的关联信息、如何解码等等)。一种视频封装格式的直接反映就是对应着相应的视频文件格式。 下面我们就列举一些文件封装格式: AVI 格式 ,对应的文件格式为