Firebase ML Kit: Nhận dạng ngôn ngữ ( Language Indentification) trong Android

Đăng bởi: Admin | Lượt xem: 1643 | Chuyên mục: Android

Với API nhận dạng ngôn ngữ của ML Kit, bạn có thể xác định hơn 100 ngôn ngữ khác nhau trong cả tập lệnh gốc và chữ viết hoa.


1. Giới thiệu

Nhận dạng ngôn ngữ là quá trình xác định ngôn ngữ của văn bản.

Ngày nay, các ứng dụng di động được sử dụng ở mọi nơi trên thế giới, bởi những người dùng khác nhau, nói các ngôn ngữ khác nhau. Nhận dạng ngôn ngữ có thể giúp bạn hiểu ngôn ngữ của người dùng và cá nhân hóa ứng dụng của bạn dựa trên ngôn ngữ đó.

Với API nhận dạng ngôn ngữ của ML Kit, bạn có thể xác định hơn 100 ngôn ngữ khác nhau trong cả tập lệnh gốc và chữ viết hoa.

2. Cài đặt

Bước 1: Thêm Firebase vào ứng dụng của bạn

Bạn có thể thêm Firebase vào ứng dụng của mình bằng cách làm theo các bước được đề cập ở đây .

Bước 2: Thêm các phụ thuộc

Bạn cần thêm các phụ thuộc ML Kit tệp build.gradle

dependencies {
  // ...
  implementation 'com.google.firebase:firebase-ml-natural-language:18.1.1'
  implementation 'com.google.firebase:firebase-ml-natural-language-language-id-model:18.0.2'
}

Bước 3

Mô hình Nhận dạng Ngôn ngữ yêu cầu một văn bản dưới dạng Chuỗi để nhận dạng, văn bản này từ EditText hoặc API Speech-to-Text...

Bước 4:

Chuẩn bị mô hình Nhận dạng Ngôn ngữ

val languageIdentifier = FirebaseNaturalLanguage.getInstance()
        .languageIdentification

Bạn cũng có thể thay đổi ngưỡng tin cậy của mô hình nhận dạng ngôn ngữ của mình bằng cách chuyển vào một đối tượng của FirebaseLanguageIdentificationOptions

val options = FirebaseLanguageIdentificationOptions.Builder()
        .setConfidenceThreshold(0.2F)
        .build()
val languageIdentifier = FirebaseNaturalLanguage.getInstance()
        .getLanguageIdentification(options)

Bước 5: 

Cuối cùng, chúng ta có thể chuyển văn bản của mình cho mô hình để Nhận dạng Ngôn ngữ.

languageIdentifier.identifyLanguage(text)
        .addOnSuccessListener {
            // Task completed successfully
        }
        .addOnFailureListener {
            // Task failed with an exception
        }

Bước 6: Trích xuất thông tin


Nếu nhận dạng ngôn ngữ thành công, ta sẽ nhận được mã ngôn ngữ BCP-47 cho ngôn ngữ đó. Nếu mô hình không phát hiện bất kỳ ngôn ngữ nào, ta sẽ nhận được und (không xác định).

Danh sách đầy đủ của tất cả các ngôn ngữ được hỗ trợ có thể được tìm thấy ở đây

Bạn có thể trích xuất thông tin này như thế này.

languageIdentifier.identifyLanguage(text)
        .addOnSuccessListener {
            val language = it
        }

Kết quả

Mã nguồn đầy đủ:

https://github.com/hitanshu-dhawan/FirebaseMLKit/tree/master/app/src/main/java/com/hitanshudhawan/firebasemlkitexample/languageidentification

vncoder logo

Theo dõi VnCoder trên Facebook, để cập nhật những bài viết, tin tức và khoá học mới nhất!



Khóa học liên quan

Khóa học: Android

Học Kotlin cơ bản
Số bài học:
Lượt xem: 17646
Đăng bởi: Admin
Chuyên mục: Android

Học lập trình Flutter cơ bản
Số bài học:
Lượt xem: 58659
Đăng bởi: Admin
Chuyên mục: Android

Lập trình Android cơ bản
Số bài học:
Lượt xem: 23028
Đăng bởi: Admin
Chuyên mục: Android