> ## Documentation Index > Fetch the complete documentation index at: https://mintlify.com/XDcobra/react-native-sherpa-onnx/llms.txt > Use this file to discover all available pages before exploring further. # Audio Utilities > Audio capture, conversion, and processing utilities Utilities for working with audio in React Native, including live microphone capture and audio format conversion. ## createPcmLiveStream() Create a PCM live stream from the device microphone with automatic resampling. ```typescript theme={null} function createPcmLiveStream( options?: PcmLiveStreamOptions ): PcmLiveStreamHandle ``` ### Parameters Live stream configuration options. Target sample rate in Hz (e.g., 16000 for STT). Number of audio channels (1 = mono, 2 = stereo). Buffer size in frames (0 = auto). ### Returns Start capturing audio from microphone. Requires `RECORD_AUDIO` permission (Android) and `NSMicrophoneUsageDescription` (iOS). Stop capturing audio. Register callback for audio data. Returns unsubscribe function. Register callback for errors. Returns unsubscribe function. ### Permissions **Android:** Add to `AndroidManifest.xml`: ```xml theme={null} ``` **iOS:** Add to `Info.plist`: ```xml theme={null} NSMicrophoneUsageDescription This app needs microphone access for speech recognition ``` Request permissions at runtime: ```typescript theme={null} import { PermissionsAndroid, Platform } from 'react-native'; if (Platform.OS === 'android') { await PermissionsAndroid.request( PermissionsAndroid.PERMISSIONS.RECORD_AUDIO ); } ``` ### Example: Basic Microphone Capture ```typescript theme={null} import { createPcmLiveStream } from 'react-native-sherpa-onnx/audio'; const mic = createPcmLiveStream({ sampleRate: 16000, channelCount: 1, }); // Handle audio data const unsubscribeData = mic.onData((samples, sampleRate) => { console.log('Received', samples.length, 'samples at', sampleRate, 'Hz'); // samples is Float32Array in range [-1, 1] }); // Handle errors const unsubscribeError = mic.onError((message) => { console.error('Microphone error:', message); }); // Start recording await mic.start(); // Later: stop recording await mic.stop(); unsubscribeData(); unsubscribeError(); ``` ### Example: Live Speech Recognition ```typescript theme={null} import { createPcmLiveStream } from 'react-native-sherpa-onnx/audio'; import { createStreamingSTT, assetModelPath } from 'react-native-sherpa-onnx/stt'; const engine = await createStreamingSTT({ modelPath: assetModelPath('models/streaming-zipformer-en'), modelType: 'auto', }); const stream = await engine.createStream(); const mic = createPcmLiveStream({ sampleRate: 16000 }); const unsubscribe = mic.onData(async (samples, sampleRate) => { const { result, isEndpoint } = await stream.processAudioChunk( samples, sampleRate ); console.log('Live transcription:', result.text); if (isEndpoint) { console.log('Utterance complete:', result.text); await stream.reset(); } }); await mic.start(); // Later: cleanup await mic.stop(); unsubscribe(); await stream.release(); await engine.destroy(); ``` *** ## convertAudioToFormat() Convert any supported audio file to a requested format. ```typescript theme={null} function convertAudioToFormat( inputPath: string, outputPath: string, format: string, outputSampleRateHz?: number ): Promise ``` ### Parameters Absolute path to input audio file. Absolute path for output file. Output format: `'mp3'`, `'flac'`, `'wav'`, etc. Output sample rate in Hz. For MP3: 32000, 44100, or 48000 (default: 44100). For WAV: always 16000 mono (sherpa-onnx). ### Platform Support * **Android**: Requires FFmpeg prebuilts * **iOS**: Supported ### Example ```typescript theme={null} import { convertAudioToFormat } from 'react-native-sherpa-onnx/audio'; import { DocumentDirectoryPath } from '@dr.pogodin/react-native-fs'; // Convert to MP3 await convertAudioToFormat( `${DocumentDirectoryPath}/input.wav`, `${DocumentDirectoryPath}/output.mp3`, 'mp3', 44100 ); // Convert to FLAC await convertAudioToFormat( `${DocumentDirectoryPath}/input.m4a`, `${DocumentDirectoryPath}/output.flac`, 'flac' ); ``` *** ## convertAudioToWav16k() Convert any supported audio file to WAV 16 kHz mono 16-bit PCM. ```typescript theme={null} function convertAudioToWav16k( inputPath: string, outputPath: string ): Promise ``` This is a convenience function for preparing audio for STT (most models expect 16 kHz mono). ### Parameters Absolute path to input audio file. Absolute path for output WAV file. ### Platform Support * **Android**: Requires FFmpeg prebuilts * **iOS**: Supported ### Example ```typescript theme={null} import { convertAudioToWav16k } from 'react-native-sherpa-onnx/audio'; import { createSTT, assetModelPath } from 'react-native-sherpa-onnx/stt'; import { DocumentDirectoryPath } from '@dr.pogodin/react-native-fs'; const inputPath = `${DocumentDirectoryPath}/recording.m4a`; const wavPath = `${DocumentDirectoryPath}/recording-16k.wav`; // Convert to 16kHz mono WAV await convertAudioToWav16k(inputPath, wavPath); // Transcribe const stt = await createSTT({ modelPath: assetModelPath('models/whisper-tiny'), }); const result = await stt.transcribeFile(wavPath); console.log('Transcription:', result.text); await stt.destroy(); ``` *** ## Types ### PcmLiveStreamOptions Configuration options for live PCM stream. ```typescript theme={null} interface PcmLiveStreamOptions { /** Target sample rate in Hz (e.g., 16000) */ sampleRate?: number; /** Number of audio channels (1 = mono, 2 = stereo) */ channelCount?: number; /** Buffer size in frames (0 = auto) */ bufferSizeFrames?: number; } ``` ### PcmLiveStreamHandle Handle returned by `createPcmLiveStream()`. ```typescript theme={null} interface PcmLiveStreamHandle { start(): Promise; stop(): Promise; onData( callback: (samples: Float32Array, sampleRate: number) => void ): () => void; onError(callback: (message: string) => void): () => void; } ``` *** ## See Also * [Streaming STT](/api/stt/streaming-stt) - Using live audio with speech recognition * [Streaming TTS](/api/tts/streaming-tts) - Built-in PCM playback * [Core Functions](/api/core) - Library initialization