本文还有配套的精品资源,点击获取 menu-r.4af5f7ec.gif

简介:Sipdroid是一款基于SIP协议的开源Android VoIP应用,支持语音通话功能。本文围绕Sipdroid源码,深入讲解SIP协议的工作原理、注册与呼叫流程、媒体协商机制,并对应用的架构设计、网络通信模块、媒体处理、UI实现、权限配置等核心部分进行详细解析。通过项目实战,开发者可掌握Android平台下VoIP系统的构建方法,提升网络通信与音视频处理能力,适用于VoIP系统开发与学习。

1. SIP协议基本概念与工作原理

SIP(Session Initiation Protocol)是一种基于文本的信令协议,广泛应用于VoIP和多媒体通信中,用于建立、修改和终止会话。其设计借鉴了HTTP协议的结构,具备良好的扩展性和灵活性。

1.1 SIP核心组件与角色

SIP系统中主要包含以下几类实体:

  • UA(User Agent) :用户代理,分为UAC(客户端)和UAS(服务端),负责发起或响应SIP请求。
  • 代理服务器(Proxy Server) :转发SIP请求,可进行路由、重写等操作。
  • 重定向服务器(Redirect Server) :不转发请求,而是返回目标地址供发起方重新发送。
  • 注册服务器(Registrar Server) :用于UA注册其当前地址信息。

1.2 SIP消息结构与方法类型

SIP消息分为 请求消息 响应消息 ,结构如下:

<start-line>       // 请求行或状态行
header1: value1    // 头部字段
header2: value2
<empty line>       // 空行分隔头部与正文
[message body]     // 消息体(如SDP协商内容)

常用SIP请求方法包括:

方法 描述
INVITE 发起会话请求
ACK 确认最终响应
BYE 终止会话
REGISTER 向注册服务器注册用户地址
OPTIONS 查询对方能力
CANCEL 取消尚未完成的请求

1.3 SIP事务机制与状态机

SIP事务(Transaction)是指一个请求及其所有响应的全过程。每个事务都有其状态机模型,例如:

  • 客户端事务 :处理UAC发起的请求,状态包括:初始(Initial)、尝试(Proceeding)、完成(Completed)、终止(Terminated)等。
  • 服务端事务 :处理UAS接收的请求,状态包括:初始(Initial)、尝试(Proceeding)、最终响应(Final Response)等。

事务机制确保了SIP请求与响应的有序性和可靠性,是实现SIP协议稳定通信的基础。

2. SIP注册流程实现与分析

SIP注册流程是VoIP通信中至关重要的一步,它决定了用户代理(User Agent,UA)能否成功加入SIP网络并被其他用户发现。本章将围绕SIP注册请求(REGISTER)展开,深入分析其工作原理、在Android平台的实现方式、常见问题排查方法以及以Sipdroid为例的注册机制剖析。通过本章内容,开发者将掌握SIP注册流程的完整实现逻辑与调试手段。

2.1 SIP注册流程概述

SIP注册流程的核心目的是将用户代理(UA)的身份信息(如SIP URI)绑定到当前网络地址,使得SIP服务器能够将其他用户的呼叫请求正确地转发到该UA。这一流程是SIP会话建立的基础,其正确性直接影响到后续通话的可达性。

2.1.1 注册请求(REGISTER)的作用与场景

SIP REGISTER请求用于向SIP服务器注册用户的位置信息。常见场景包括:

  • 用户首次登录VoIP应用时;
  • 用户切换网络(如从Wi-Fi切换到4G)时;
  • 注册过期(默认为3600秒)后自动重新注册;
  • 用户主动注销时发送带有Contact头字段为空的REGISTER请求。

REGISTER请求的基本结构如下所示:

REGISTER sip:example.com SIP/2.0
Via: SIP/2.0/UDP 192.168.1.100:5060;branch=z9hG4bK123456
Max-Forwards: 70
To: <sip:user@example.com>
From: <sip:user@example.com>;tag=12345
Call-ID: abcdefghijklmnopqrstuvwxyz
CSeq: 1 REGISTER
Contact: <sip:user@192.168.1.100:5060>
Expires: 3600
Content-Length: 0

参数说明:

  • Via :指定请求的传输路径;
  • To / From :标识注册的用户;
  • Call-ID :唯一标识本次注册会话;
  • CSeq :命令序列号,用于排序;
  • Contact :当前UA的地址信息;
  • Expires :注册有效期,单位为秒;
  • Content-Length :消息体长度,通常为0。

2.1.2 注册状态与SIP服务器交互流程

注册流程主要包含以下几个步骤:

  1. UA发送REGISTER请求;
  2. 服务器返回401 Unauthorized;
  3. UA发送带有认证信息的REGISTER请求;
  4. 服务器返回200 OK;
  5. UA进入注册成功状态。

流程图如下所示:

sequenceDiagram
    participant UA
    participant Registrar
    UA->>Registrar: REGISTER (无认证)
    Registrar-->>UA: 401 Unauthorized
    UA->>Registrar: REGISTER (含认证信息)
    Registrar-->>UA: 200 OK
    UA->>Registrar: REGISTER (定期刷新)

注册成功后,UA进入“已注册”状态,服务器将维护该UA的联系人信息。一旦注册过期,UA需重新发送REGISTER请求。

2.2 Android中SIP注册实现

Android平台提供了 SipManager SipProfile 等类用于简化SIP协议的实现。开发者可以利用这些API快速构建SIP注册功能。

2.2.1 使用SipManager类实现注册

以下代码展示如何使用 SipManager 实现SIP注册:

SipManager sipManager = SipManager.newInstance(context);
SipProfile.Builder builder = new SipProfile.Builder("username", "sip.example.com");
builder.setPassword("password");
SipProfile sipProfile = builder.build();

Intent intent = new Intent();
PendingIntent pendingIntent = PendingIntent.getBroadcast(context, 0, intent, PendingIntent.FLAG_UPDATE_CURRENT);

sipManager.open(sipProfile, pendingIntent, null);

if (sipManager.isRegistered(sipProfile.getUriString())) {
    Log.d("SIP", "Already registered");
} else {
    sipManager.register(sipProfile, 3600, pendingIntent);
}

代码逻辑分析:

  1. SipManager.newInstance(context) :获取SIP服务的实例;
  2. SipProfile.Builder :构建SIP用户配置;
  3. open() :打开SIP连接;
  4. register() :发起注册请求;
  5. PendingIntent :用于接收SIP事件广播。

参数说明:

  • username :SIP账号用户名;
  • sip.example.com :SIP服务器域名;
  • 3600 :注册有效期,单位为秒;
  • pendingIntent :用于监听SIP广播事件。

2.2.2 注册状态监听与回调处理

注册状态可通过广播接收器监听:

public class SipReceiver extends BroadcastReceiver {
    @Override
    public void onReceive(Context context, Intent intent) {
        String action = intent.getAction();
        if (SipManager.ACTION_SIP_REGISTRATION.equals(action)) {
            boolean isRegistered = intent.getBooleanExtra(SipManager.EXTRA_IS_REGISTERED, false);
            String profileUri = intent.getStringExtra(SipManager.EXTRA_PROFILE_URI);
            if (isRegistered) {
                Log.d("SIP", "Registered to " + profileUri);
            } else {
                Log.e("SIP", "Registration failed for " + profileUri);
            }
        }
    }
}

参数说明:

  • ACTION_SIP_REGISTRATION :注册状态变更广播;
  • EXTRA_IS_REGISTERED :是否注册成功;
  • EXTRA_PROFILE_URI :对应的SIP地址。

注册成功后,系统将通过广播通知应用,开发者可根据状态更新UI或继续进行呼叫操作。

2.3 注册失败常见问题与调试

SIP注册失败是VoIP应用开发中的常见问题之一,主要原因包括网络配置问题、认证失败、日志调试不充分等。

2.3.1 网络配置问题(NAT、防火墙)

由于SIP使用UDP协议,NAT和防火墙可能阻止SIP消息的传输。解决方案包括:

  • 使用STUN服务器进行NAT穿透;
  • 在路由器上配置端口映射;
  • 使用TCP或TLS代替UDP。

2.3.2 认证失败与账号配置错误

认证失败通常表现为401或407响应码。常见原因包括:

  • 密码错误;
  • 用户名或域配置错误;
  • SIP服务器未启用摘要认证。

建议在注册失败时,检查账号信息并启用调试日志查看具体错误码。

2.3.3 日志分析与抓包工具使用技巧

Android平台可使用以下工具进行注册流程调试:

  • adb logcat :查看SIP注册日志;
  • Wireshark或tcpdump:抓取SIP消息;
  • SIP服务器日志:查看服务器端处理情况。

示例命令:

adb logcat -s SipService:SipStack

该命令可过滤SIP相关的系统日志,帮助快速定位问题。

2.4 Sipdroid中的注册机制分析

Sipdroid是一个开源的Android VoIP客户端,其注册机制具有良好的工程实践意义。以下将从注册线程管理、状态维护与信息持久化等方面进行分析。

2.4.1 注册线程与状态管理

Sipdroid采用独立线程处理注册流程,确保不影响主线程UI操作。其注册状态机如下所示:

stateDiagram
    [*] --> Unregistered
    Unregistered --> Registering : 发起注册请求
    Registering --> Registered : 收到200 OK
    Registered --> Unregistered : 注册过期或注销
    Registering --> Failed : 收到错误响应
    Failed --> Retry : 重试机制

注册线程通过 Handler 与主线程通信,状态变化时更新UI界面。

2.4.2 注册信息的持久化与更新策略

Sipdroid将注册信息持久化至SharedPreferences中,确保应用重启后仍可恢复注册状态。注册信息包括:

字段名 描述
username SIP账号用户名
domain SIP服务器域名
password 密码
expires 注册有效期
last_registered 上次注册时间戳

更新策略包括:

  • 每次注册成功后更新 last_registered
  • 每次启动时根据 last_registered expires 判断是否需要重新注册;
  • 自动重试机制(指数退避)应对网络波动。

以上为第二章《SIP注册流程实现与分析》的完整内容,涵盖了注册请求的基本原理、Android平台实现、常见问题调试与Sipdroid注册机制分析,内容深度递进,结合代码、流程图与表格,符合专业级IT博客的写作标准。

3. SIP呼叫流程(INVITE、ACK、BYE等消息交互)

3.1 SIP呼叫建立过程详解

3.1.1 INVITE请求与会话初始化

SIP协议的核心功能之一是建立多媒体会话,而建立会话的第一步就是发送 INVITE 请求。 INVITE 是SIP中的请求方法之一,用于发起一次会话。该请求消息中包含了发起方的会话描述(通常是SDP格式),包括媒体类型、编码、网络地址和端口等信息。

下面是一个典型的 INVITE 请求示例:

INVITE sip:bob@domain.com SIP/2.0
Via: SIP/2.0/UDP 192.168.1.1:5060;branch=z9hG4bK776asdhds
Max-Forwards: 70
From: Alice <sip:alice@domain.com>;tag=1928301774
To: Bob <sip:bob@domain.com>
Call-ID: a84b4c76e66710@192.168.1.1
CSeq: 314159 INVITE
Contact: <sip:alice@192.168.1.1:5060>
Content-Type: application/sdp
Content-Length: 142

v=0
o=Alice 2890844526 2890844526 IN IP4 192.168.1.1
s=-
c=IN IP4 192.168.1.1
t=0 0
m=audio 49170 RTP/AVP 0
a=rtpmap:0 PCMU/8000

逐行解读:

  • INVITE sip:bob@domain.com SIP/2.0 :表示这是一个INVITE请求,目标地址是bob@domain.com。
  • Via :指示请求的传输路径,包含发送方的IP地址和端口号。
  • Max-Forwards :限制请求的最大跳数,防止环路。
  • From To :表示请求的发起者和目标用户,带有tag参数用于对话标识。
  • Call-ID :唯一标识此次会话的字符串。
  • CSeq :命令序列号,用于排序请求和响应。
  • Contact :提供发起者的直接联系地址。
  • Content-Type :指定消息体的类型,这里是SDP。
  • Content-Length :消息体长度。

逻辑分析:

当用户A(Alice)想呼叫用户B(Bob)时,Alice的SIP客户端生成一个包含SDP描述的 INVITE 请求,并发送到Bob的SIP服务器或直接发送给Bob的终端设备。服务器接收到 INVITE 后,将其转发给目标用户,并触发振铃等通知。

3.1.2 响应码(1xx、2xx、4xx等)含义与处理

SIP协议使用标准的响应码来标识请求的处理状态,这些响应码分为五类:

响应码范围 含义说明
1xx 临时响应,如180 Ringing
2xx 成功响应,如200 OK
3xx 重定向响应
4xx 客户端错误,如404 Not Found
5xx 服务器错误
6xx 全局失败

典型响应示例:

SIP/2.0 180 Ringing
Via: SIP/2.0/UDP 192.168.1.1:5060;branch=z9hG4bK776asdhds
From: Alice <sip:alice@domain.com>;tag=1928301774
To: Bob <sip:bob@domain.com>;tag=83112343
Call-ID: a84b4c76e66710@192.168.1.1
CSeq: 314159 INVITE
Content-Length: 0
SIP/2.0 200 OK
Via: SIP/2.0/UDP 192.168.1.1:5060;branch=z9hG4bK776asdhds
From: Alice <sip:alice@domain.com>;tag=1928301774
To: Bob <sip:bob@domain.com>;tag=83112343
Call-ID: a84b4c76e66710@192.168.1.1
CSeq: 314159 INVITE
Contact: <sip:bob@192.168.1.2:5060>
Content-Type: application/sdp
Content-Length: 142

v=0
o=bob 2890844526 2890844526 IN IP4 192.168.1.2
s=-
c=IN IP4 192.168.1.2
t=0 0
m=audio 49172 RTP/AVP 0
a=rtpmap:0 PCMU/8000

响应处理逻辑:

  • 当Bob的终端接收到 INVITE 后,它会返回一个 180 Ringing 响应,表示正在处理请求。
  • 如果Bob接受呼叫,则返回 200 OK ,并在消息体中携带Bob的SDP描述。
  • 如果Bob拒绝呼叫,则返回 486 Busy Here 或其他错误码。

3.1.3 ACK确认与会话确认机制

当发起方收到 200 OK 响应后,需要发送一个 ACK 请求来确认会话建立成功。这个过程是SIP会话建立的关键步骤之一。

ACK请求示例:

ACK sip:bob@domain.com SIP/2.0
Via: SIP/2.0/UDP 192.168.1.1:5060;branch=z9hG4bK776asdhds
From: Alice <sip:alice@domain.com>;tag=1928301774
To: Bob <sip:bob@domain.com>;tag=83112343
Call-ID: a84b4c76e66710@192.168.1.1
CSeq: 314159 ACK
Content-Length: 0

流程图示意(mermaid格式):

sequenceDiagram
    participant Alice
    participant Bob

    Alice->>Bob: INVITE
    Bob-->>Alice: 180 Ringing
    Bob-->>Alice: 200 OK (SDP)
    Alice->>Bob: ACK
    Note right of Alice: 会话正式建立

关键机制说明:

  • ACK 请求的CSeq必须与之前的 INVITE 相同,只是方法改为 ACK
  • 收到 ACK 后,双方都进入“会话已建立”状态,开始媒体流传输(如RTP)。
  • 如果未收到 ACK ,Bob可能重发 200 OK ,但通常只重发一次。

3.2 通话中的会话维护

3.2.1 BYE请求与通话终止

当一方希望结束通话时,应发送 BYE 请求。该请求不包含SDP消息体,仅用于终止会话。

BYE请求示例:

BYE sip:bob@domain.com SIP/2.0
Via: SIP/2.0/UDP 192.168.1.1:5060;branch=z9hG4bK776asdhds
From: Alice <sip:alice@domain.com>;tag=1928301774
To: Bob <sip:bob@domain.com>;tag=83112343
Call-ID: a84b4c76e66710@192.168.1.1
CSeq: 314160 BYE
Content-Length: 0

响应示例:

SIP/2.0 200 OK
Via: SIP/2.0/UDP 192.168.1.2:5060;branch=z9hG4bK776asdhds
From: Bob <sip:bob@domain.com>;tag=83112343
To: Alice <sip:alice@domain.com>;tag=1928301774
Call-ID: a84b4c76e66710@192.168.1.1
CSeq: 314160 BYE
Content-Length: 0

逻辑分析:

  • 发送 BYE 的一方主动断开会话连接。
  • 接收方回应 200 OK 后,会话正式结束。
  • 此时双方应停止发送媒体流并释放资源。

3.2.2 会话刷新(re-INVITE)机制

在长时间通话中,可能需要修改会话参数(如媒体类型、编码、网络地址等)。此时可通过 re-INVITE 机制重新协商会话。

re-INVITE流程示例:

INVITE sip:bob@domain.com SIP/2.0
Via: SIP/2.0/UDP 192.168.1.1:5060;branch=z9hG4bK776asdhds
From: Alice <sip:alice@domain.com>;tag=1928301774
To: Bob <sip:bob@domain.com>;tag=83112343
Call-ID: a84b4c76e66710@192.168.1.1
CSeq: 314161 INVITE
Content-Type: application/sdp
Content-Length: 142

v=0
o=Alice 2890844526 2890844527 IN IP4 192.168.1.1
s=-
c=IN IP4 192.168.1.1
t=0 0
m=audio 49170 RTP/AVP 8
a=rtpmap:8 PCMA/8000

响应与ACK:

Bob收到 re-INVITE 后,返回新的SDP描述,并在确认后发送 ACK ,完成参数更新。

流程图示意(mermaid):

sequenceDiagram
    participant Alice
    participant Bob

    Alice->>Bob: re-INVITE (新SDP)
    Bob-->>Alice: 200 OK (新SDP)
    Alice->>Bob: ACK
    Note right of Alice: 会话参数更新完成

应用场景:

  • 修改媒体编码(例如从G.711切换为G.729)
  • 切换网络地址或端口(如NAT改变)
  • 添加视频流或移除媒体流

3.3 Android平台SIP呼叫实现

3.3.1 使用SipAudioCall发起与接听电话

Android SDK提供了 SipManager SipAudioCall 类用于实现SIP语音通话功能。以下是一个发起呼叫的代码示例:

SipManager manager = ...; // 初始化SipManager
SipProfile localProfile = ...; // 初始化本地SIP账户
SipProfile remoteProfile = new SipProfile.Builder("bob", "sip.server.com").build();

try {
    SipAudioCall.Listener listener = new SipAudioCall.Listener() {
        @Override
        public void onCallEstablished(SipAudioCall call) {
            call.startAudio();
            call.setSpeakerMode(true);
        }
    };

    SipAudioCall call = manager.makeAudioCall(localProfile.getUriString(), remoteProfile.getUriString(), listener, 30);
} catch (Exception e) {
    Log.e("SIP", "Call failed", e);
}

参数说明:

  • localProfile.getUriString() :本地SIP账号的URI。
  • remoteProfile.getUriString() :目标用户的SIP URI。
  • listener :用于监听呼叫状态变化的回调。
  • 30 :超时时间(秒)。

接听电话代码示例:

SipAudioCall.Listener listener = new SipAudioCall.Listener() {
    @Override
    public void onCallReceived(SipAudioCall call, int state) {
        try {
            call.answerCall(30);
            call.startAudio();
        } catch (Exception e) {
            Log.e("SIP", "Answer failed", e);
        }
    }
};

3.3.2 呼叫状态监听与UI反馈处理

在Android中,建议通过广播或回调方式监听SIP呼叫状态变化,并更新UI。例如:

public class SipCallReceiver extends BroadcastReceiver {
    @Override
    public void onReceive(Context context, Intent intent) {
        String action = intent.getAction();
        if (SipManager.ACTION_SIP_CALL_CHANGED.equals(action)) {
            SipAudioCall call = intent.getParcelableExtra(SipManager.EXTRA_SIP_CALL);
            switch (call.getState()) {
                case SipAudioCall.STATE_CALLING:
                    // 显示呼叫中UI
                    break;
                case SipAudioCall.STATE_INCOMING_CALL:
                    // 显示来电UI
                    break;
                case SipAudioCall.STATE_CONNECTED:
                    // 显示通话中UI
                    break;
                case SipAudioCall.STATE_DISCONNECTED:
                    // 显示挂断UI
                    break;
            }
        }
    }
}

逻辑分析:

  • 通过注册 SipCallReceiver 监听器,可以实时获取通话状态。
  • 在UI中根据状态切换不同的界面元素,如按钮、提示信息等。

3.4 Sipdroid中的呼叫流程分析

3.4.1 呼叫建立线程与资源分配

Sipdroid是一个开源的SIP客户端项目,其内部通过多线程管理SIP呼叫流程。核心流程包括:

  • 网络IO线程处理SIP消息收发。
  • 会话线程处理会话建立、媒体协商、媒体流传输。
  • 资源管理线程负责音频设备初始化、RTP/RTCP流管理。

典型线程模型(mermaid流程图):

graph TD
    A[UI Thread] --> B(SIP IO Thread)
    B --> C{Call Event}
    C -->|Incoming| D[Session Thread]
    C -->|Outgoing| E[Session Thread]
    D --> F[Media Thread]
    E --> F
    F --> G[音频设备管理]
    F --> H[RTP流处理]

3.4.2 异常中断处理与错误恢复机制

Sipdroid通过异常监听机制和自动重试策略应对通话中断问题:

  • 网络中断恢复: 自动尝试重新注册并恢复会话。
  • 媒体流异常: 检测RTP超时并尝试重新协商媒体参数。
  • 错误码处理: 对408(请求超时)、480(暂时不可达)等常见错误进行分类处理。

代码片段:

public void onCallError(int errorCode) {
    switch (errorCode) {
        case SipErrorCode.TIMEOUT:
            Log.d("SIP", "Call timeout, retrying...");
            retryCall();
            break;
        case SipErrorCode.SERVER_INTERNAL_ERROR:
            Log.e("SIP", "Server error, notify user");
            showServerErrorDialog();
            break;
        default:
            Log.e("SIP", "Unknown error: " + errorCode);
    }
}

参数说明:

  • errorCode :来自SIP堆栈的错误码。
  • retryCall() :实现自动重试逻辑。
  • showServerErrorDialog() :用户提示。

逻辑分析:

Sipdroid通过统一的错误处理接口,将底层SIP错误映射到上层业务逻辑,并根据错误类型执行不同的恢复策略,提升用户体验与系统健壮性。

4. SDP媒体协商机制

SIP协议用于建立多媒体会话,而会话过程中媒体参数的协商依赖于SDP(Session Description Protocol)。SDP是一种用于描述多媒体会话属性的协议,广泛用于SIP会话中进行媒体能力交换、编码选择、网络地址和端口协商等关键任务。本章将深入解析SDP协议的结构与作用,探讨音频编码协商机制、网络端口与地址协商流程,并结合Sipdroid项目的实现,展示SDP在实际VoIP应用中的处理方式。

4.1 SDP协议概述

SDP协议是IETF定义的用于描述多媒体通信会话的协议,其核心作用是在SIP会话中交换媒体参数,确保会话双方能够协商出一致的媒体配置。SDP本身并不负责传输,它通常作为SIP消息体(如INVITE或200 OK)中的payload进行传输。

4.1.1 SDP在SIP会话中的作用

在SIP呼叫流程中,SDP的主要作用包括:

  • 媒体类型描述 :如音频、视频、文本等。
  • 编解码器支持列表 :列出主叫和被叫方支持的编解码器。
  • 网络传输信息 :包含IP地址、端口号、传输协议(如RTP/UDP)等。
  • 会话时长与时间安排 :定义会话的开始与结束时间。
  • 加密与安全参数 :如SRTP、DTLS等安全机制的协商。

SDP的协商过程通常发生在INVITE与200 OK消息之间,双方通过交换SDP信息达成一致的媒体配置。

4.1.2 SDP消息结构与关键字段解析

SDP消息由多个以单个字母开头的字段组成,每个字段表示不同的信息类型。其基本结构如下:

v=0
o=user1 53655765 2353687637 IN IP4 192.168.1.1
s=-
c=IN IP4 192.168.1.1
t=0 0
m=audio 3456 RTP/AVP 0 8 101
a=rtpmap:0 PCMU/8000
a=rtpmap:8 PCMA/8000
a=rtpmap:101 telephone-event/8000
a=fmtp:101 0-16
关键字段说明:
字段 含义
v= 协议版本号,当前为0
o= 会话发起者信息,包含用户名、会话ID、版本号、网络类型、地址类型和地址
s= 会话名称,通常为“-”表示未命名
c= 连接信息,包括网络类型、地址类型和IP地址
t= 会话时间,通常为0 0表示永久会话
m= 媒体描述,包括媒体类型、端口号、传输协议、编码格式等
a= 属性描述,如rtpmap、fmtp、ptime等
示例分析:

在上述SDP中:

  • m=audio 3456 RTP/AVP 0 8 101 表示使用UDP协议的RTP传输音频,端口为3456,支持的编码为0(PCMU)、8(PCMA)、101(telephone-event)。
  • a=rtpmap:0 PCMU/8000 表示编码0映射为PCMU,采样率为8000Hz。
  • a=fmtp:101 0-16 表示telephone-event的参数为0-16,即支持的DTMF音。

SDP的完整性和正确性直接影响到媒体协商的成功与否,因此在实际开发中需要对SDP进行严格解析和生成。

4.2 音频编码协商机制

在VoIP通信中,音频编码的协商是确保通信质量的关键步骤。不同设备和网络环境下支持的编码不同,SIP会话需要根据双方支持的编码进行协商,选择最优的编码方案。

4.2.1 支持的音频编解码器(G.711、G.729、iLBC等)

VoIP系统中常见的音频编解码器包括:

编码 描述 码率(kbps) 特点
G.711 PCM编码,用于传统电话系统 64 高音质,高带宽需求
G.729 CS-ACELP编码,压缩率高 8 广泛使用,需专利授权
iLBC 互联网低比特率编码 13.3 / 15.2 抗丢包能力强,适合互联网
Opus 开源音频编码,适应性强 6~510 高质量语音与音乐兼容

在SIP会话中,主叫方在INVITE消息中通过SDP提供支持的编码列表,被叫方在200 OK中返回其所支持的编码。最终选择的编码为双方共同支持的优先级最高的编码。

4.2.2 编码优先级与动态选择策略

在实际应用中,编码选择策略通常遵循以下原则:

  • 优先级排序 :客户端通常配置编码优先级,例如G.729 > iLBC > G.711。
  • 网络环境适应 :带宽充足时选择高质量编码(如G.711),网络较差时切换为低带宽编码(如iLBC)。
  • 动态协商机制 :通话过程中可根据网络质量动态切换编码,如使用re-INVITE进行重新协商。

例如,在Sipdroid中,音频编码优先级可以通过配置文件或运行时动态调整:

List<String> codecs = new ArrayList<>();
codecs.add("G729");
codecs.add("iLBC");
codecs.add("G711");
SDP编码字段示例:
m=audio 3456 RTP/AVP 18 101 0
a=rtpmap:18 G729/8000
a=rtpmap:101 telephone-event/8000
a=rtpmap:0 PCMU/8000

该SDP表示支持G.729、telephone-event和PCMU编码,其中G.729优先级最高。

在实际开发中,编码协商逻辑通常包含如下步骤:

  1. 解析对方SDP中的编码列表
  2. 比较本地支持的编码集合
  3. 选择优先级最高的共同编码
  4. 生成响应SDP并设置选中的编码

4.3 网络端口与地址协商

在SIP会话中,媒体数据通常通过RTP协议传输,因此必须协商媒体端口和网络地址。此外,由于NAT的存在,还需要使用STUN、TURN等机制进行NAT穿透。

4.3.1 RTP/RTCP端口分配

RTP(Real-time Transport Protocol)负责传输媒体数据,RTCP(RTP Control Protocol)用于传输控制信息。通常RTP和RTCP使用相邻端口,例如RTP使用3456,RTCP使用3457。

在SDP中,端口信息通过 m= 字段指定:

m=audio 3456 RTP/AVP 0

该字段表示RTP使用3456端口,RTCP则使用3457端口。

在Android平台上,通常使用 AudioGroup AudioStream 类来绑定端口并处理RTP数据流:

AudioStream audioStream = new AudioStream();
audioStream.setMode(RtpStream.MODE_NORMAL);
audioStream.open(3456, 3457); // RTP端口和RTCP端口

4.3.2 NAT穿透与STUN机制

由于大多数设备处于NAT后面,直接通信可能失败。STUN(Session Traversal Utilities for NAT)协议用于获取设备的公网IP和端口,以便进行NAT穿透。

STUN交互流程(简化版):
sequenceDiagram
    participant Client
    participant STUN_Server

    Client->>STUN_Server: 发送STUN Binding Request
    STUN_Server->>Client: 回复Binding Response,包含反射的IP和端口
    Client->>SIP_Server: 在SDP中填写反射的IP和端口
示例代码(使用开源库):
StunClient stunClient = new StunClient("stun.l.google.com", 19302);
StunResponse response = stunClient.sendBindingRequest();
String publicIp = response.getXorMappedAddress().getAddress();
int publicPort = response.getXorMappedAddress().getPort();

在生成SDP时,将反射的IP和端口填入:

c=IN IP4 1.2.3.4
m=audio 5004 RTP/AVP 0

STUN机制大大提高了SIP在NAT环境下的通信成功率,但面对对称型NAT仍需使用TURN中继服务器。

4.4 Sipdroid中的SDP处理实现

Sipdroid作为开源的SIP客户端,其SDP处理模块是整个媒体协商流程的核心部分。本节将分析其SDP生成与解析模块,并探讨媒体参数的动态更新机制。

4.4.1 SDP生成与解析模块

Sipdroid中使用 SdpParser 类来解析收到的SDP信息,使用 SdpGenerator 类生成本地SDP信息。

示例代码:SDP解析
public class SdpParser {
    public SdpSession parse(String sdpStr) {
        SdpSession session = new SdpSession();
        String[] lines = sdpStr.split("\r\n");
        for (String line : lines) {
            if (line.startsWith("m=")) {
                String[] parts = line.split(" ");
                session.mediaType = parts[1];
                session.port = Integer.parseInt(parts[2]);
                session.codecList = Arrays.asList(parts).subList(4, parts.length);
            } else if (line.startsWith("a=rtpmap:")) {
                // 解析编码映射
            }
        }
        return session;
    }
}
示例代码:SDP生成
public class SdpGenerator {
    public String generate(SdpSession session) {
        StringBuilder sb = new StringBuilder();
        sb.append("v=0\r\n");
        sb.append("o=- 1234567890 1234567890 IN IP4 ").append(session.localIp).append("\r\n");
        sb.append("s=Sipdroid Call\r\n");
        sb.append("c=IN IP4 ").append(session.localIp).append("\r\n");
        sb.append("t=0 0\r\n");
        sb.append("m=audio ").append(session.port).append(" RTP/AVP ");
        sb.append(TextUtils.join(" ", session.codecList)).append("\r\n");
        for (String codec : session.codecList) {
            sb.append(codecToRtpmap(codec)).append("\r\n");
        }
        return sb.toString();
    }
}

4.4.2 媒体参数动态更新与切换机制

在通话过程中,可能会因网络质量变化或用户手动切换编码而需要重新协商媒体参数。Sipdroid通过发送re-INVITE请求来实现媒体参数的更新。

re-INVITE流程示意图:
graph TD
    A[主叫发送re-INVITE] --> B[被叫收到并处理]
    B --> C[生成新的SDP]
    C --> D[返回200 OK]
    D --> E[主叫确认ACK]
    E --> F[媒体参数更新生效]

在代码中,re-INVITE的发送通常如下:

SipSession session = getSipSession();
session.sendReInvite();

re-INVITE的SDP中可包含新的编码、端口或网络地址信息,双方重新协商后即可更新媒体流配置。

此外,Sipdroid还支持动态切换音频编码,例如根据网络质量自动选择低带宽编码:

if (networkQuality.isLow()) {
    currentCodec = selectLowBandwidthCodec();
} else {
    currentCodec = selectHighQualityCodec();
}
sendReInviteWithNewSdp();

这种动态协商机制提升了通话的稳定性和适应性。

本章系统讲解了SDP在SIP会话中的作用、音频编码协商机制、网络地址与端口的协商流程,并结合Sipdroid项目的实现展示了SDP的实际处理方式。在实际开发中,理解并掌握SDP的结构与处理逻辑,对于构建稳定、高效的VoIP应用至关重要。

5. Android VoIP应用开发实践与优化

5.1 Sipdroid项目架构设计与模块划分

Sipdroid 是一个开源的 SIP 客户端项目,其设计目标是提供一个完整的 VoIP 解决方案。整个项目采用模块化设计,便于功能扩展和维护。

5.1.1 应用整体架构图与模块职责

Sipdroid 的架构主要包括以下几个核心模块:

  • SIP 服务模块 :负责 SIP 协议栈的初始化、注册、呼叫建立与销毁。
  • 媒体处理模块 :负责音频采集、播放、编解码以及网络传输。
  • UI 模块 :处理用户界面交互,包括来电界面、拨号界面、通话界面等。
  • 状态管理模块 :监听并管理通话状态、网络状态和用户登录状态。
  • 持久化模块 :用于保存用户配置、注册信息、通话记录等。
graph TD
    A[SIP服务模块] --> B[媒体处理模块]
    A --> C[状态管理模块]
    C --> D[UI模块]
    D --> E[持久化模块]
    B --> F[RTP传输]
    A --> G[SIP信令交互]

5.1.2 核心服务(SIP服务、媒体服务)的生命周期管理

Sipdroid 使用 Android 的 Service 组件来管理 SIP 服务的生命周期。通过绑定 Service,UI 模块可以与后台服务进行通信。

// 启动 SIP 服务
Intent serviceIntent = new Intent(this, SipService.class);
startService(serviceIntent);

// 绑定服务
bindService(serviceIntent, sipServiceConnection, Context.BIND_AUTO_CREATE);

媒体服务则根据通话状态动态创建和销毁,以节省系统资源。

5.2 Android平台媒体处理

5.2.1 AudioTrack与MediaRecorder在VoIP中的应用

在 VoIP 应用中, AudioTrack 用于播放远端音频流, MediaRecorder 则用于采集本地音频输入。

// 初始化 AudioTrack
AudioTrack audioTrack = new AudioTrack(
    AudioManager.STREAM_VOICE_CALL,
    sampleRateInHz,
    AudioFormat.CHANNEL_OUT_MONO,
    AudioFormat.ENCODING_PCM_16BIT,
    bufferSizeInBytes,
    AudioTrack.MODE_STREAM
);

// 初始化 MediaRecorder
MediaRecorder mediaRecorder = new MediaRecorder();
mediaRecorder.setAudioSource(MediaRecorder.AudioSource.VOICE_COMMUNICATION);
mediaRecorder.setOutputFormat(MediaRecorder.OutputFormat.THREE_GPP);
mediaRecorder.setAudioEncoder(MediaRecorder.AudioEncoder.AMR_NB);
mediaRecorder.setOutputFile("/dev/null"); // 仅采集音频数据
mediaRecorder.prepare();
mediaRecorder.start();

5.2.2 回声消除与降噪处理策略

Sipdroid 集成了 WebRTC 提供的音频处理模块来实现回声消除(AEC)和自动增益控制(AGC):

// 初始化音频处理模块
WebRtcAec aec = new WebRtcAec();
aec.init(sampleRateInHz, channelCount);

// 在音频采集后调用 AEC 处理
byte[] audioData = ...; // 原始音频数据
aec.process(audioData, refAudioData, outputData);

降噪处理则通过设置 AudioManager 模式为 MODE_IN_COMMUNICATION 来启用系统级噪声抑制。

5.3 网络事件与通话状态监听处理

5.3.1 网络连接变化监听

Sipdroid 使用 ConnectivityManager BroadcastReceiver 监听网络状态变化:

ConnectivityManager connectivityManager = (ConnectivityManager) getSystemService(Context.CONNECTIVITY_SERVICE);
NetworkRequest request = new NetworkRequest.Builder()
        .addTransportType(NetworkCapabilities.TRANSPORT_WIFI)
        .addTransportType(NetworkCapabilities.TRANSPORT_CELLULAR)
        .build();

connectivityManager.registerNetworkCallback(request, networkCallback);

当网络断开时,应用会尝试重新注册 SIP 服务或暂停通话。

5.3.2 来电与去电状态同步与UI更新

通话状态通过 SipAudioCall.Listener 回调通知 UI:

SipAudioCall.Listener listener = new SipAudioCall.Listener() {
    @Override
    public void onCallEstablished(SipAudioCall call) {
        // 更新 UI 为通话中状态
        updateCallUI(CallState.ACTIVE);
    }

    @Override
    public void onCallEnded(SipAudioCall call) {
        // 结束通话,释放资源
        releaseCallResources();
    }
};

UI 模块通过 LiveData 或 Event Bus 实现状态的实时更新。

5.4 AndroidManifest权限配置与系统适配

5.4.1 必需权限清单与动态权限申请

Sipdroid 需要在 AndroidManifest.xml 中声明以下权限:

<uses-permission android:name="android.permission.INTERNET" />
<uses-permission android:name="android.permission.RECORD_AUDIO" />
<uses-permission android:name="android.permission.MODIFY_AUDIO_SETTINGS" />
<uses-permission android:name="android.permission.WAKE_LOCK" />
<uses-permission android:name="android.permission.FOREGROUND_SERVICE" />

对于 Android 6.0(API 23)及以上版本,需动态申请录音权限:

if (ContextCompat.checkSelfPermission(this, Manifest.permission.RECORD_AUDIO)
        != PackageManager.PERMISSION_GRANTED) {
    ActivityCompat.requestPermissions(this,
            new String[]{Manifest.permission.RECORD_AUDIO}, REQUEST_CODE_AUDIO);
}

5.4.2 Android 6.0以上版本兼容性处理

在 Android 6.0+ 中,需启用 Doze 模式下的网络访问权限:

<application
    android:networkSecurityConfig="@xml/network_security_config"
    android:allowBackup="true"
    android:usesCleartextTraffic="true">
</application>

同时使用 JobScheduler WorkManager 实现后台任务调度,以适应系统资源管理机制。

5.5 日志调试与性能优化

5.5.1 日志记录策略与问题定位技巧

Sipdroid 使用 Log 类输出调试日志,并将关键日志写入文件:

Log.d("SipService", "Registering to SIP server: " + serverAddress);

日志文件路径示例:

/data/data/org.sipdroid.app/files/logs/sipdroid.log

使用 adb logcat 可实时查看日志:

adb logcat -s "SipService"

5.5.2 内存管理与线程优化策略

Sipdroid 使用线程池管理并发任务:

ExecutorService executor = Executors.newFixedThreadPool(4);
executor.execute(() -> {
    // 执行 SIP 注册任务
});

对象复用和弱引用机制减少内存泄漏风险:

WeakHashMap<Context, SipService> serviceMap = new WeakHashMap<>();

5.5.3 低功耗模式下的VoIP行为调整

针对 Android 6.0+ 的 Doze 模式,Sipdroid 通过设置 AlarmManager 触发定期注册:

AlarmManager alarmManager = (AlarmManager) getSystemService(Context.ALARM_SERVICE);
PendingIntent pendingIntent = PendingIntent.getService(context, 0, intent, 0);
alarmManager.setInexactRepeating(AlarmManager.ELAPSED_REALTIME_WAKEUP,
        SystemClock.elapsedRealtime() + 60000, 60000, pendingIntent);

同时启用前台服务保持进程活跃:

startForeground(NOTIFICATION_ID, notification);

5.6 基于libpjsip库的集成与扩展

5.6.1 libpjsip简介与优势

libpjsip 是一个开源的 SIP 协议栈实现,具有高性能、跨平台、模块化等特点,广泛用于 VoIP 客户端开发。其优势包括:

  • 支持 SIP、SDP、RTP、STUN、TURN、ICE 等协议
  • 提供音频/视频编解码、媒体处理功能
  • 支持 Android、iOS、Linux、Windows 平台

5.6.2 在Android项目中集成libpjsip

  1. 下载并编译 libpjsip for Android:
    bash $ cd pjproject $ ./configure-android $ make dep && make

  2. 将生成的 .so 文件放入 app/src/main/jniLibs/ 目录。

  3. 在 Java 代码中加载 native 库并调用接口:

System.loadLibrary("pjsua2");

5.6.3 自定义SIP功能模块扩展与封装

可以通过继承 Account Call 类实现自定义 SIP 逻辑:

class MyAccount : public Account {
public:
    void onRegState(OnRegStateParam &prm) {
        // 自定义注册状态处理
    }
};

class MyCall : public Call {
public:
    void onCallState(OnCallStateParam &prm) {
        // 自定义通话状态处理
    }
};

在 Android 层封装 JNI 接口:

public class PjSipWrapper {
    public native void initLib();
    public native void makeCall(String uri);
    public native void hangUp();
}

本文还有配套的精品资源,点击获取 menu-r.4af5f7ec.gif

简介:Sipdroid是一款基于SIP协议的开源Android VoIP应用,支持语音通话功能。本文围绕Sipdroid源码,深入讲解SIP协议的工作原理、注册与呼叫流程、媒体协商机制,并对应用的架构设计、网络通信模块、媒体处理、UI实现、权限配置等核心部分进行详细解析。通过项目实战,开发者可掌握Android平台下VoIP系统的构建方法,提升网络通信与音视频处理能力,适用于VoIP系统开发与学习。


本文还有配套的精品资源,点击获取
menu-r.4af5f7ec.gif

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐