AVFoundation--文字转语音

iOS自带文字转语音功能,实现很简单,接下来我们就一起来学习这个简单酷炫的功能。

要实现文字转语音,我们只需要简单的几个类,从本文你将学到:

  • 将文字(汉语、英语等)转化为语音输出
  • 掌握语音合成器:AVSpeechSynthesizer
    语言设置:AVSpeechSynthesisVoice
    发声对象:AVSpeechUtterance的使用
  • 文字转语音demo

其合成过程如下:由AVSpeechSynthesisVoice设置语言环境,AVSpeechUtterance设置需要转化的文字,并对语速、音调、音量等进行控制,最后由AVSpeechSynthesizer来进行播放。

  • AVSpeechSynthesisVoice

  • 1、创建语言环境
//参数为需要设置的语言
AVSpeechSynthesisVoice *voice = [AVSpeechSynthesisVoice voiceWithLanguage:@"zh-TW"];
//获取当前设置的语言
[AVSpeechSynthesisVoice currentLanguageCode];
  • 2、获取支持的语言
//通过如下方法可以查看所支持的语言,可根据需要从中选取所需语言
NSArray *voices =  [AVSpeechSynthesisVoice speechVoices];
常用语言如下:
     en-GB//英语(英式)
     en-US//英语(美式)
     zh-CN//汉语(普通话)
     zh-HK//汉语(粤语)
     zh-TW//汉语(台湾)
  • AVSpeechUtterance

// 创建语音合成器
    AVSpeechSynthesizer *synthesizer = [[AVSpeechSynthesizer alloc] init];
    
    // 实例化发声的对象
    AVSpeechUtterance *utterance = [AVSpeechUtterance speechUtteranceWithString:@"我有一只小毛驴"];
    //语言,为AVSpeechSynthesisVoice的一个对象
    utterance.voice = voice;    
    //语速,0~1
    utterance.rate = 0.5;
    //声音,0~1
    utterance.volume = 1;
    //音调0.5~2
    utterance.pitchMultiplier = 1;
    //播放前的延时
    utterance.preUtteranceDelay = 3;
    //播放后的延时,一般用于设置连续播放多段文字的间隔
    utterance.postUtteranceDelay = 1;

  • AVSpeechSynthesizer

    1. 使用
AVSpeechSynthesizer *synthesizer = [[AVSpeechSynthesizer alloc] init];
//播放
[synthesizer speakUtterance:utterance];
    1. 方法介绍
//开始播放
- (void)speakUtterance:(AVSpeechUtterance *)utterance;
//停止播放,调用此方法会立刻停止,并清空utterance队列
- (BOOL)stopSpeakingAtBoundary:(AVSpeechBoundary)boundary;
//暂停播放
- (BOOL)pauseSpeakingAtBoundary:(AVSpeechBoundary)boundary;
//继续播放
- (BOOL)continueSpeaking;

需要说明的是调用speakUtterance:方法时其实是把utterance添加到播放队列,synthesizer会从该队列里面顺序取出utterance逐个播放,也就是我们可以一次性添加多个utterance,播放时则会顺序播放。

  • 3.代理方法,如有需要可以在代理 房中做一些处理
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didStartSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"开始:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didPauseSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"暂停:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didCancelSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"取消:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer willSpeakRangeOfSpeechString:(NSRange)characterRange utterance:(AVSpeechUtterance *)utterance {
    NSLog(@"将要开始:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didContinueSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"继续:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didFinishSpeechUtterance:(AVSpeechUtterance *)utterance {
    NSLog(@"完成:%@",utterance.speechString);
}
  • Demo

写了一个简单的demo测试了一下,demo中仅有两个类,FireSpeecher用于播放控制,FireVoiceModely用于设置需要播放低文字及相关属性的配置:
1 FireSpeecher类:

typedef NS_ENUM(NSInteger, PauseType) {
    PauseTypeImmediate,//立刻停止
    PauseTypeByWord//读完本字(单词)后再停止
};

@interface FireSpeecher : NSObject

/**
 暂停或者停止类型
 */
@property (nonatomic, assign) PauseType pauseType;

/**
 初始化

 @param models 需要转化的文字Model
 @return FireSpeecher对象
 */
- (instancetype)initWithModels:(NSArray *)models;

/**
播放

 @return YES-->播放成功,NO-->播放失败
 */
- (BOOL)speech;

/**
 暂停播放
 
 @return YES-->暂停成功,NO-->暂停失败
 */
- (BOOL)pausedSpeech;

/**
 停止
 
 @return YES-->停止成功,NO-->停止失败
 */
- (BOOL)stopeSpeech;
/**
 继续播放
 
 @return YES-->继续播放成功,NO-->继续播放失败
 */
- (BOOL)contiueSpeech;

2 FireVoiceModel类:

typedef NS_ENUM(NSInteger, LanguageType) {
  LanguageTypeDefault,//默认(普通话)
  LanguageTypeCH,//中文(普通话)
  LanguageTypeHK,//香港(粤语)
  LanguageTypeTW,//中文(台湾)
  LanguageTypeUS,//英语(美式)
  LanguageTypeEN//英语(英式)
};

@interface FireVoiceModel : NSObject

/**
要说的句子
*/
@property (nonatomic , copy) NSString *string;

/**
语言类型
*/
@property (nonatomic, assign) LanguageType languageType;

/**
说话速率,0~1,默认0.5
*/
@property (nonatomic, assign) CGFloat rate;

/**
音调,0.5~2.0,默认1.0
*/
@property (nonatomic, assign) CGFloat pinch;

/**
音量,0~1,默认为1
*/
@property (nonatomic, assign) CGFloat volume;

/**
说话前的时间,默认为0
*/
@property (nonatomic, assign) NSTimeInterval preDelay;

/**
说话后的延时时间,默认为0
*/
@property (nonatomic, assign) NSTimeInterval postDelay;

使用就很简单了,语言默认中文普通话,包括语速、音调可以在model中对每句话单独进行设置:

NSMutableArray *array = [NSMutableArray arrayWithCapacity:5];
    for (int i = 0; i < 5; i ++) {
        FireVoiceModel *model = [[FireVoiceModel alloc] init];
        model.string = @"哈哈";
        model.postDelay = 1;
        [array addObject:model];
    }
    FireSpeecher *speecher = [[FireSpeecher alloc] initWithModels:array];
    if ([speecher speech]) {
        NSLog(@"开讲啦");
    }else {
        NSLog(@"出错啦");
    }

Demo地址

你可能感兴趣的:(AVFoundation--文字转语音)