Firebase ML Kit: Nhận dạng ngôn ngữ ( Language Indentification) trong Android
Với API nhận dạng ngôn ngữ của ML Kit, bạn có thể xác định hơn 100 ngôn ngữ khác nhau trong cả tập lệnh gốc và chữ viết hoa.
1. Giới thiệu
Nhận dạng ngôn ngữ là quá trình xác định ngôn ngữ của văn bản.
Ngày nay, các ứng dụng di động được sử dụng ở mọi nơi trên thế giới, bởi những người dùng khác nhau, nói các ngôn ngữ khác nhau. Nhận dạng ngôn ngữ có thể giúp bạn hiểu ngôn ngữ của người dùng và cá nhân hóa ứng dụng của bạn dựa trên ngôn ngữ đó.
Với API nhận dạng ngôn ngữ của ML Kit, bạn có thể xác định hơn 100 ngôn ngữ khác nhau trong cả tập lệnh gốc và chữ viết hoa.
2. Cài đặt
Bước 1: Thêm Firebase vào ứng dụng của bạn
Bạn có thể thêm Firebase vào ứng dụng của mình bằng cách làm theo các bước được đề cập ở đây .
Bước 2: Thêm các phụ thuộc
Bạn cần thêm các phụ thuộc ML Kit tệp build.gradle
dependencies {
// ...
implementation 'com.google.firebase:firebase-ml-natural-language:18.1.1'
implementation 'com.google.firebase:firebase-ml-natural-language-language-id-model:18.0.2'
}
Bước 3:
Mô hình Nhận dạng Ngôn ngữ yêu cầu một văn bản dưới dạng Chuỗi để nhận dạng, văn bản này từ EditText hoặc API Speech-to-Text...
Bước 4:
Chuẩn bị mô hình Nhận dạng Ngôn ngữ
val languageIdentifier = FirebaseNaturalLanguage.getInstance()
.languageIdentification
Bạn cũng có thể thay đổi ngưỡng tin cậy của mô hình nhận dạng ngôn ngữ của mình bằng cách chuyển vào một đối tượng của FirebaseLanguageIdentificationOptions
val options = FirebaseLanguageIdentificationOptions.Builder()
.setConfidenceThreshold(0.2F)
.build()
val languageIdentifier = FirebaseNaturalLanguage.getInstance()
.getLanguageIdentification(options)
Bước 5:
Cuối cùng, chúng ta có thể chuyển văn bản của mình cho mô hình để Nhận dạng Ngôn ngữ.
languageIdentifier.identifyLanguage(text)
.addOnSuccessListener {
// Task completed successfully
}
.addOnFailureListener {
// Task failed with an exception
}
Bước 6: Trích xuất thông tin
Nếu nhận dạng ngôn ngữ thành công, ta sẽ nhận được mã ngôn ngữ BCP-47 cho ngôn ngữ đó. Nếu mô hình không phát hiện bất kỳ ngôn ngữ nào, ta sẽ nhận được und
(không xác định).
Danh sách đầy đủ của tất cả các ngôn ngữ được hỗ trợ có thể được tìm thấy ở đây
Bạn có thể trích xuất thông tin này như thế này.
languageIdentifier.identifyLanguage(text)
.addOnSuccessListener {
val language = it
}
Kết quả
Mã nguồn đầy đủ:
Theo dõi VnCoder trên Facebook, để cập nhật những bài viết, tin tức và khoá học mới nhất!