Android实现录音静音降噪
作者:suwen8100 发布时间:2023-01-06 23:46:25
标签:Android,录音,静音
本文实例为大家分享了Android实现录音静音降噪的具体代码,供大家参考,具体内容如下
需求:
客户反馈产品的录音里面很多杂音(因为我们把Codec的录音增益调至最大,且电路上没有专用的音频处理芯片、CPU直接接MIC(有包地))。在外壳、硬件不能修改的情况下,软件得想想办法尝试解决问题。
首先想到的是双麦降噪,原理大概是:一个主麦克风用来做通话,另一个收集环境噪音,对音频波形分析和相位操作,叠加到主麦克风的采样波形上,形成相位抵消,就降噪了。缺点是,两个麦克风不能距离太近,并且两个麦克风距离说话人的距离不能太远,太远了角度就很小了,根本无法分辨出来,另外,根据产品使用情况,上下麦克风各自都有几率称为主麦克风。所以实验测试出来的结果并没有很好。
考虑到录音噪音在有“人声”的时候是分辨不出来的、或者说影响很小,而在静音时有明显的环境噪声,因此想使用静音降噪的方法来规避问题。
本文只是简单的静音降噪,原理如下:考虑到启动录音时,要等待一段时间(比如0.5s)才会有人声,可根据这0.5s时间来预测噪声的大小(阈值),然后以此为基础来检测“人声”的起始点。在人声到来前,把所有音频数据设置为0,也就是做静音处理,所以这里叫静音降噪。而人声到来时,返回实际的音频数据(包括里面的噪声数据)。计算阈值的方法只是简单的求和平均。
下面代码在RK平台上hardware/alsa_sound/AudioStreamInALSA.cpp实现。
#define MUTE_NOISE_REDUCTION
#ifdef MUTE_NOISE_REDUCTION
bool enable_reduction_noise = false;?? ?//由属性sys.is.audiorecord.only控制
int threshold_def = 0x400;?? ?//默认阈值
int threshold = 0;?? ?//自适应噪声阈值
int threshold_count = 0;?? ?//计数,超过THRESHOLD_COUNT则使用threshold来检测“人声”
#define THRESHOLD_COUNT 10
#define MUTE_DELAY_COUNT 15?? ??? ?//播放人声后保留的音频帧数、不静音
#define AUDIO_BUFFER_NUM 4?? ??? ?//缓存音频数据的帧数
#define AUDIO_BUFFER_SIZE 1024?? ?//一帧的音频数据大小
char *audio_buffer[AUDIO_BUFFER_NUM];?? ?//audio_buffer用于缓存音频数据
char *audio_buffer_temp;?? ?//用于交互音频数据
int audio_buffer_pos=0;
#endif
#ifdef MUTE_NOISE_REDUCTION
? ? {
? ? ? ? unsigned int value = 0;
? ? ? ? int is_voice = 0;
? ? ? ? static int is_mute_delay_count;
? ? ? ? //ALOGE("in_begin_swip_num:%d in_begin_narrow_num=%d",in_begin_swip_num,in_begin_narrow_num);?? ??? ?
? ? ? ? ?if(enable_reduction_noise && bytes > AUDIO_BUFFER_SIZE){
? ? ? ? ? ? bytes = AUDIO_BUFFER_SIZE;
? ? ? ? }
? ? ? ? if(enable_reduction_noise){
? ? ? ? ? ? unsigned char * buffer_temp=(unsigned char *)buffer;
? ? ? ? ? ? unsigned int total = 0;
? ? ? ? ? ? unsigned int total_count=0;
?? ??? ??? ?unsigned int total_temp = 0;
? ? ? ? ? ? short data16;
? ? ? ? ? ? int j = 0;
? ? ? ? ? ? for(j=0; j<bytes; j=j+2){
? ? ? ? ? ? ? ? value = buffer_temp[j+1];?? ?//第二个字节为高位数据
? ? ? ? ? ? ? ? value = (value<<8)+buffer_temp[j];?? ?//获得一个16bit的音频数据
? ? ? ? ? ? ? ? data16 = value&0xFFFF;
? ? ? ? ? ? ? ? if( (data16 & 0x8000) == 0){//正数
?? ??? ??? ??? ??? ?total +=data16;?? ??? ?//思考:会不会溢出
?? ??? ??? ??? ??? ?total_count++;?? ??? ?//计数
? ? ? ? ? ? ? ? }
? ? ? ? ? ? }
?? ??? ??? ?total_temp = total/total_count;
? ? ? ? ? ? if(total_temp > threshold_def){
? ? ? ? ? ? ? ? is_voice++;?? ??? ?//检测到人声
? ? ? ? ? ? }else {?? ?//is noise
?? ??? ??? ??? ?if(threshold_count == 0){
?? ??? ??? ??? ??? ?threshold = total_temp;
?? ??? ??? ??? ?}else{
?? ??? ??? ??? ??? ?threshold = (threshold+total_temp)/2;
?? ??? ??? ??? ?}
?? ??? ??? ??? ?threshold_count++;
?? ??? ??? ??? ?if(threshold_count >= THRESHOLD_COUNT){
?? ??? ??? ??? ??? ?threshold_def = threshold*2;?? ?//更新阈值,这里的2要对产品实验来确定。
?? ??? ??? ??? ??? ?threshold_count = THRESHOLD_COUNT;?? ?//此后一直用新阈值,直到停止录音
?? ??? ??? ??? ?}
?? ??? ??? ?}
?? ??? ??? ?//is_mute_delay_count的意义是,如果前面播放了人声,那再停止说话之后继续保留MUTE_DELAY_COUNT的音频数据,这样不会“戛然而止”。
?? ? ? ? ? ?if( is_voice != 0 ){
?? ? ? ? ? ? ? ?is_mute_delay_count=MUTE_DELAY_COUNT;
?? ? ? ? ? ?}else{
?? ? ? ? ? ? ? ?if(is_mute_delay_count != 0)
?? ? ? ? ? ? ? ? ? ?is_mute_delay_count--;
?? ? ? ? ? ?}
?? ??? ??? ?//audio_buffer的意义:检测到人声,要返回说话前的一小段音频数据,否则声音从静音到人声有个POP声的跳跃。
?? ??? ??? ?//这里用audio_buffer来缓存AUDIO_BUFFER_NUM帧数据。
?? ? ? ? ? ?if(is_mute_delay_count == 0){//Mute in order to remove noise
?? ? ? ? ? ? ? ?memcpy(audio_buffer[audio_buffer_pos], (char *)buffer, bytes);?? ?//缓存音频
?? ? ? ? ? ? ? ?memset(buffer, 0, bytes);?? ?//返回静音数据
?? ? ? ? ? ?}else {
?? ? ? ? ? ? ? ?memcpy(audio_buffer_temp, (char *)buffer, bytes);
?? ? ? ? ? ? ? ?memcpy((char *)buffer, audio_buffer[audio_buffer_pos], bytes);?? ?//返回旧的音频数据
?? ? ? ? ? ? ? ?memcpy(audio_buffer[audio_buffer_pos], (char *)audio_buffer_temp, bytes); ?? ?//保存新的音频数据
?? ? ? ? ? ?}
?? ??? ??? ?audio_buffer_pos++;
?? ??? ??? ?if(audio_buffer_pos>=AUDIO_BUFFER_NUM)
? ? ? ? ? ? ? ? audio_buffer_pos=0;
? ? ? ? }
? ? }
#endif
来源:https://blog.csdn.net/suwen8100/article/details/117068805


猜你喜欢
- 前言日常开发中,缓存是解决数据库压力的一种方案,通常用于频繁查询的数据,例如新闻中的热点新闻,本文记录springboot中使用cache缓
- 判断字符串是否为IP地址通常都是基于正则表达式实现的,无论是引入外部的依赖包亦或是自己写正则实现,基本都是基于正则表达式实现的判断。然而比较
- springboot多模块化整合mybatis,mapper自动注入失败问题启动类添加@MapperScan或@ComponentScan,
- 哎,最近很好久没写点东西了,由于工作的原因,接触公司自己研发的底层orm框架,偶然发现该框架在调用jdbc操作的时候参考的是hibernat
- 目录 * 仓库的配置1、 下载sonatype Nexus来搭建 * 2 安装nexus服务3、创建 * 仓库4、配置 * 信息中央仓库的配置三个仓
- Maven 多profile及指定编译要点项目A依赖项目B,项目A、B都有对应的多个profile,通过mvn –P参数指定profile,
- 这篇总结的形式是提出个问题,然后给出问题的答案。这是目前学习知识的一种尝试,可以让学习更有目的。Q1.什么时候应当重写对象的equals方法
- 一、使用Json.NetJson.Net是支持序列化和反序列化DataTable、DataSet、Entity Framework和Enti
- java中next与nextLine用法区别:next()一定要读取到有效字符后才可以结束输入,对输入有效字符之前遇到的空格键、Tab键或E
- POST接口formdata传参模板记录var res = ""; HttpClient _httpClient = n
- 本文实例讲述了C#判断一个矩阵是否为对称矩阵及反称矩阵的方法。分享给大家供大家参考。具体如下:1.判断对称矩阵对任意i和j,有a[i,j]=
- 模式介绍桥接模式(Bridge模式)是指:将实现与抽象放在两个不同的类层次中,使两个层次可以独立改变。是一种结构型设计模式。Bridge模式
- 客户端import java.io.BufferedReader;import java.io.InputStreamReader;impo
- 本文实例讲述了Android实现将一个Activity设置成窗口样式的方法。分享给大家供大家参考,具体如下:1.在res/value文件夹下
- 一、JdbcTemplateSpring 框架对 JDBC 进行封装,使用 JdbcTemplate 方便实现对数据库操作二、实战2.1 引
- 基于比较的排序算法基本原理及Java实现1. 七大基于比较的排序-总览1.1常见基于比较的排序分类1.2时间复杂度,空间复杂度以及稳定性。稳
- 前言之前写的progress其实根本没有起到进度条的作用,太显眼,而且并不好看,所以有了新的想法,我们将ProgressBar控件换成See
- 短网址应用已经在全国各大微博上开始流行了起来。例如QQ微博的url.cn,新郎的sinaurl.cn等。我们在QQ微博上发布网址的时候,微博
- 一.背景在复习《C++基础与提高》时,自己实现运算符重载(i++)时,几次都报错。其实还是自己对运算符重载这一部分内容理解得不够透彻,于是再
- 饿汉式饿汉式:类加载就会导致该单实例对象被创建// 问题1:为什么加 final// 问题2:如果实现了序列化接口, 还要做什么来防止反序列