Android 选择图片识别图片转文字-CFANZ编程社区

在Android应用中实现选择图片并进行文字识别（OCR）的功能，可以分为以下几个步骤：

1. 添加权限

在AndroidManifest.xml文件中添加读取存储权限，因为图片可能来自用户的图库。

<uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE"/>

2. 图片选择

使用Intent让用户从图库中选择图片：

private void chooseImageFromGallery() {
    Intent intent = new Intent(Intent.ACTION_PICK);
    intent.setType("image/*");
    startActivityForResult(intent, PICK_IMAGE_REQUEST_CODE);
}

@Override
protected void onActivityResult(int requestCode, int resultCode, @Nullable Intent data) {
    super.onActivityResult(requestCode, resultCode, data);
    if (requestCode == PICK_IMAGE_REQUEST_CODE && resultCode == RESULT_OK && data != null) {
        Uri selectedImageUri = data.getData();
        // 之后调用图片转文字的方法
        recognizeTextFromImage(selectedImageUri);
    }
}

3. 图片转文字

使用Google ML Kit

Google ML Kit提供了预置的OCR模型，可以方便地集成到Android应用中，实现图片转文字的功能。

1)添加依赖：

在build.gradle文件中添加ML Kit的依赖。如果是使用Firebase，需要添加Firebase的依赖；如果只使用离线OCR功能，可以只添加ML Kit的独立库。

   // 使用Firebase的ML Kit
   implementation 'com.google.firebase:firebase-ml-vision:24.0.3'

   // 或者，只使用ML Kit独立库（离线OCR）
   implementation 'com.google.mlkit:text-recognition:16.0.0'

2)权限声明：

在AndroidManifest.xml中添加读取外部存储的权限（如果图片来自外部存储）。

   <uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE"/>

3)实现图片识别代码：

编写代码加载图片并使用ML Kit进行文字识别。

   // 导入必要的包
   import com.google.mlkit.vision.common.InputImage;
   import com.google.mlkit.vision.text.TextRecognition;
   import com.google.mlkit.vision.text.TextRecognizer;
   import com.google.mlkit.vision.text.latin.TextRecognizerOptions;

   // 初始化TextRecognizer
   TextRecognizer textRecognizer = TextRecognition.getClient(TextRecognizerOptions.DEFAULT_OPTIONS);

   // 加载图片
   InputImage image = InputImage.fromBitmap(bitmap, 0);

   // 执行识别
   textRecognizer.process(image)
       .addOnSuccessListener(new OnSuccessListener<Text>() {
           @Override
           public void onSuccess(Text visionText) {
               // 识别成功，获取识别的文字
               String resultText = visionText.getText();
               Log.d("OCR Result", "Text found: " + resultText);
           }
       })
       .addOnFailureListener(new OnFailureListener() {
           @Override
           public void onFailure(@NonNull Exception e) {
               // 处理识别失败的情况
               Log.e("OCR Error", "Error detecting text from image: " + e.getMessage());
           }
       });

集成第三方OCR库

除了Google ML Kit，还有其他第三方OCR库如Tesseract OCR、ABBYY SDK等，它们提供了更丰富的功能和定制化选项，但集成过程相对复杂。

Tesseract OCR集成：

1)添加依赖：

   implementation 'com.rmtheis:tess-two:9.0.0'

2)准备训练数据：

Tesseract需要对应语言的训练数据文件，可以从其官网下载并放置在合适的位置。

3)使用Tesseract进行识别：

加载图片，调用Tesseract的API进行识别。

   // 初始化Tesseract实例
   TessBaseAPI baseApi = new TessBaseAPI();
   baseApi.init(context.getFilesDir().getPath(), "eng"); // "eng" 是语言代码

   // 将图片转换为Bitmap
   Bitmap bitmap = BitmapFactory.decodeFile(imagePath);

   // 设置图片并进行识别
   baseApi.setImage(bitmap);
   String recognizedText = baseApi.getUTF8Text();

   // 释放资源
   baseApi.end();

实现识别逻辑

private void recognizeTextFromImage(Uri imageUri) {
    try {
        // 加载图片
        InputStream inputStream = getContentResolver().openInputStream(imageUri);
        Bitmap bitmap = BitmapFactory.decodeStream(inputStream);
        
        // 使用ML Kit进行文字识别
        InputImage inputImage = InputImage.fromBitmap(bitmap, 0);
        TextRecognizer recognizer = TextRecognition.getClient(TextRecognizerOptions.DEFAULT_OPTIONS);
        
        recognizer.process(inputImage)
            .addOnSuccessListener(new OnSuccessListener<Text>() {
                @Override
                public void onSuccess(Text visionText) {
                    String resultText = visionText.getText();
                    Log.d("OCR Result", "Text found: " + resultText);
                    // 显示或使用识别结果
                }
            })
            .addOnFailureListener(new OnFailureListener() {
                @Override
                public void onFailure(@NonNull Exception e) {
                    Log.e("OCR Error", "Error detecting text from image: " + e.getMessage());
                }
            });
    } catch (FileNotFoundException e) {
        e.printStackTrace();
    }
}