最近了解了一下Android Q(安卓10),得知Android Q基于语音识别技术,不需要联网就可以将视频中的语音实时转化成字幕这一功能。其实,在安卓中实现语音识别的代码很简单,我们要实现的就是调用谷歌API获取搜索结果,然后根据这个结果做自己想要的功能。
Android 中主要通过RecognizerIntent来实现语音识别。
常量 | 简介 |
---|---|
ACTION_RECOGNIZE_SPEECH | 开启语音识别调用 |
ACTION_WEB_SEARCH | 开启网络语音识别,结果以网页的形式显示 |
EXTRA_LANGUAGE_MODEL | 语音识别的模式 |
EXTRA_MAX_RESULTS | 返回的最大结果 |
EXTRA_PROMPT | 设置用户可以开始语音的提示语 |
EXTRA_RESULTS | 将返回的字符串集中到一个list |
LANGUAGE_MODEL_FREE_FORM | 在一种模式上的自由语音 |
LANGUAGE_MODEL_WEB_SEARCH | 使用语言模型在web上搜索 |
RESULT_AUDIO_ERROR | 返回结果时,音频遇到错误 |
RESULT_CLIENT_ERROR | 返回结果时,客户端遇到错误 |
RESULT_NETWORK_ERROR | 返回结果时,网络遇到错误 |
RESULT_NO_MATCH | 未知错误 |
RESULT_SERVER_ERROR | 返回结果时,服务端遇到错误 |
1. 首先在AndroidManifest中设置网络权限,Android 6.0以后还需要动态请求权限
<uses-permission android:name="android.permission.INTERNET" />
<uses-permission android:name="android.permission.RECORD_AUDIO" />
2.调用Google原生语音识别
@Override
public void onClick(View v) {
//开启语音识别功能
Intent intent = new Intent(
RecognizerIntent.ACTION_RECOGNIZE_SPEECH);
//设置模式,这里设置成自由模式
intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,RecognizerIntent.LANGUAGE_MODEL_FREE_FORM);
//提示语音开始文字
intent.putExtra(RecognizerIntent.EXTRA_PROMPT,"Please start your voice");
//开始进行语音识别,这里先检测手机(模拟器)是否支持语音识别并且捕获异常
try {
startActivityForResult(intent, RESULT_SPEECH);
txtText.setText("");
} catch (ActivityNotFoundException a) {
Toast t = Toast.makeText(getApplicationContext(),
"Opps! Your device doesn't support Speech to Text",
Toast.LENGTH_SHORT);
t.show();
}
}
});
3.使用onActivityResult接收返回的结果
@Override
protected void onActivityResult(int requestCode, int resultCode, Intent data) {
super.onActivityResult(requestCode, resultCode, data);
switch (requestCode) {
case RESULT_SPEECH: {
if (resultCode == RESULT_OK && data != null) {
ArrayList<String> text = data
.getStringArrayListExtra(RecognizerIntent.EXTRA_RESULTS);
//这里集合列表中第一个值为匹配度最高的值
txtText.setText(text.get(0));
}
break;
}
}
}
1.MainActivity.java代码
import androidx.appcompat.app.AppCompatActivity;
import android.os.Bundle;
import android.content.ActivityNotFoundException;
import android.content.Intent;
import android.speech.RecognizerIntent;
import android.view.Menu;
import android.view.MenuItem;
import android.view.View;
import android.widget.EditText;
import android.widget.ImageButton;
import android.widget.TextView;
import android.widget.Toast;
import java.util.ArrayList;
public class MainActivity extends AppCompatActivity {
protected static final int RESULT_SPEECH = 1;
private ImageButton btnSpeak;
private EditText txtText;
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
txtText = findViewById(R.id.txtText);
btnSpeak = (ImageButton) findViewById(R.id.btnSpeak);
btnSpeak.setOnClickListener(new View.OnClickListener() {
@Override
public void onClick(View v) {
//开启语音识别功能
Intent intent = new Intent(
RecognizerIntent.ACTION_RECOGNIZE_SPEECH);
//设置模式
intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,"en-US");
//提示语音开始文字
intent.putExtra(RecognizerIntent.EXTRA_PROMPT,"Please start your voice");
//开始进行语音识别,这里先检测手机(模拟器)是否支持语音识别并且捕获异常
try {
startActivityForResult(intent, RESULT_SPEECH);
txtText.setText("");
} catch (ActivityNotFoundException a) {
Toast t = Toast.makeText(getApplicationContext(),
"Opps! Your device doesn't support Speech to Text",
Toast.LENGTH_SHORT);
t.show();
}
}
});
}
@Override
public boolean onCreateOptionsMenu(Menu menu) {
// Inflate the menu; this adds items to the action bar if it is present.
getMenuInflater().inflate(R.menu.menu_main, menu);
return true;
}
@Override
public boolean onOptionsItemSelected(MenuItem item) {
// Handle action bar item clicks here. The action bar will
// automatically handle clicks on the Home/Up button, so long
// as you specify a parent activity in AndroidManifest.xml.
int id = item.getItemId();
//noinspection SimplifiableIfStatement
if (id == R.id.action_settings) {
return true;
}
return super.onOptionsItemSelected(item);
}
@Override
protected void onActivityResult(int requestCode, int resultCode, Intent data) {
super.onActivityResult(requestCode, resultCode, data);
switch (requestCode) {
case RESULT_SPEECH: {
if (resultCode == RESULT_OK && data != null) {
ArrayList<String> text = data
.getStringArrayListExtra(RecognizerIntent.EXTRA_RESULTS);
//这里集合列表中第一个值为匹配度最高的值
txtText.setText(text.get(0));
}
break;
}
}
}
}
2.activity_main.xml代码
<?xml version="1.0" encoding="utf-8"?>
<LinearLayout
xmlns:android="http://schemas.android.com/apk/res/android"
xmlns:tools="http://schemas.android.com/tools"
android:layout_width="fill_parent"
android:layout_height="wrap_content"
android:layout_toLeftOf="@+id/txtText"
android:gravity="center"
android:orientation="vertical">
<EditText
android:id="@+id/txtText"
android:layout_width="fill_parent"
android:layout_height="wrap_content"
android:layout_weight="1"
android:layout_gravity="left"
android:layout_marginLeft="10dp"
android:layout_marginRight="10dp"
android:layout_marginTop="10dp"
android:hint="@string/edit"/>
<ImageButton
android:id="@+id/btnSpeak"
android:layout_width="fill_parent"
android:layout_height="wrap_content"
android:layout_margin="10dp"
android:layout_marginRight="10dp"
android:layout_marginTop="10dp"
android:contentDescription="@string/speak"
android:src="@android:drawable/ic_btn_speak_now"/>
</LinearLayout>
首先我们先把整个项目运行起来,运行结果如下图
接下来我们进行语音输入,发现语音输入用不了
为什么用不了呢?
通过网上查询得知原来使用语音识别功能需要语音识别程序(google voice)的支持,但是国内现在大部分厂商的手机里都没有这个程序。此外,这个语音识别方式需要联网到google的语音库中进行识别,因为google无法访问的问题也会导致识别失败。
知道了问题所在,解决起来也就是分分钟的事情了,首先先看一下实验所使用的模拟器,如下图
发现手机型号是国产的,在预设型号里面找了一下也都是国产手机型号。
现在的解决方法有两种,第一就是换一个可以支持语音识别程序的手机型号;第二就是直接下载语音识别程序附带到程序里面,显然第二种操作起来更加实际。
因为我所使用的模拟器可以联网,所以直接用模拟器自带的浏览器进行下载语音识别程序(google voice)
当然,如果你所使用的模拟器无法联网,也可以使用在Android emulator上安装 APK的方法进行下载安装 Google Voice Search APK。
安装完成后我们再次运行项目,就会发现当我们点击使用语音的时候就可以进行语音输入了。
进行语音输入的时候,模拟器要设置成可以接收语音,这样才能输入
参考文章:
1.Android-调用自带的谷歌语音识别技术
2.关于android上调用google的语音识别功能
3.在Android emulator上安装 APK