Metin Algılama Aktivitesi
Genel Bakış
Metin Algılama aktivitesi, optik karakter tanıma (OCR) teknolojisini kullanarak görsel dosyalarından kelimeleri tanımlar ve çıkarır. Görsel içeriğini işler ve sonuçları, çıkarılan tam string'i, ayrı ayrı kelimeleri ve bunlara karşılık gelen sınırlayıcı kutuları içeren yapılandırılmış bir JSON formatında döndürür.
Parametre Tablosu
| Alan | Açıklama | Gereklilik |
|---|---|---|
| Api anahtarı | Google Cloud Vision API Anahtarı | Gerekli |
| Görsel yolu/URL | Görselin Google Cloud Storage URL'si | Gerekli |
| Base64 | Görsel dosyasının Base64 kodlu string'i | Gerekli |
| Cevap değişken ismi | HTTP cevabını depolamak için değişken ismi | Gerekli |
Eylem tipleri ve Örnekler
Algılanan Metin
- Formatla:
string - Örnek Sonuç:
"This is a sample text detected from the image."
Kelime Düzeyinde Detaylar
- Formatla:
array of objects - Örnek Sonuç:
[{"word": "This", "boundingBox": {"x": 10, "y": 20, "width": 30, "height": 10}}, {"word": "is", "boundingBox": {"x": 45, "y": 20, "width": 15, "height": 10}}]
Uygulama Örnekleri
Alan Kurulumu - Api key: bb3c53c6-8515-4e34-97c8-8281de60972d - Image path/url: gs://cloud-samples-data/vision/ocr/sampleimage.jpg - Base64: /9j/4AAQSkZJRgABAQEAYABgAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUF……………./58x/8BX+R/9k= - Response variable name: getResponse
Teknik Notlar
Metin Algılama aktivitesi, OCR yetenekleri için Google Cloud Vision API'sinden yararlanır. Başarılı yürütme için, ya
Image path/urlya daBase64alanını sağlamalısınız; her ikisini birden sağlamak gerekli değildir, ancak en az biri gereklidir. Google Cloud Vision metin algılama özellikleri hakkında daha detaylı bilgi ve dokümantasyon için resmi Google Cloud Vision dokümantasyonuna bakınız.