Metin Algılama Aktivitesi

Genel Bakış

Metin Algılama aktivitesi, optik karakter tanıma (OCR) teknolojisini kullanarak görsel dosyalarından kelimeleri tanımlar ve çıkarır. Görsel içeriğini işler ve sonuçları, çıkarılan tam string'i, ayrı ayrı kelimeleri ve bunlara karşılık gelen sınırlayıcı kutuları içeren yapılandırılmış bir JSON formatında döndürür.

Parametre Tablosu

Alan	Açıklama	Gereklilik
Api anahtarı	Google Cloud Vision API Anahtarı	Gerekli
Görsel yolu/URL	Görselin Google Cloud Storage URL'si	Gerekli
Base64	Görsel dosyasının Base64 kodlu string'i	Gerekli
Cevap değişken ismi	HTTP cevabını depolamak için değişken ismi	Gerekli

Eylem tipleri ve Örnekler

Algılanan Metin

Formatla: string
Örnek Sonuç: "This is a sample text detected from the image."

Kelime Düzeyinde Detaylar

Formatla: array of objects
Örnek Sonuç: [{"word": "This", "boundingBox": {"x": 10, "y": 20, "width": 30, "height": 10}}, {"word": "is", "boundingBox": {"x": 45, "y": 20, "width": 15, "height": 10}}]

Uygulama Örnekleri

Alan Kurulumu - Api key: bb3c53c6-8515-4e34-97c8-8281de60972d - Image path/url: gs://cloud-samples-data/vision/ocr/sampleimage.jpg - Base64: /9j/4AAQSkZJRgABAQEAYABgAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUF……………./58x/8BX+R/9k= - Response variable name: getResponse

Teknik Notlar

Metin Algılama aktivitesi, OCR yetenekleri için Google Cloud Vision API'sinden yararlanır. Başarılı yürütme için, ya Image path/url ya da Base64 alanını sağlamalısınız; her ikisini birden sağlamak gerekli değildir, ancak en az biri gereklidir. Google Cloud Vision metin algılama özellikleri hakkında daha detaylı bilgi ve dokümantasyon için resmi Google Cloud Vision dokümantasyonuna bakınız.