Ana içeriğe geç

Metin Algılama Aktivitesi

Genel Bakış

Metin Algılama aktivitesi, optik karakter tanıma (OCR) teknolojisini kullanarak görsel dosyalarından kelimeleri tanımlar ve çıkarır. Görsel içeriğini işler ve sonuçları, çıkarılan tam string'i, ayrı ayrı kelimeleri ve bunlara karşılık gelen sınırlayıcı kutuları içeren yapılandırılmış bir JSON formatında döndürür.

Parametre Tablosu

Alan Açıklama Gereklilik
Api anahtarı Google Cloud Vision API Anahtarı Gerekli
Görsel yolu/URL Görselin Google Cloud Storage URL'si Gerekli
Base64 Görsel dosyasının Base64 kodlu string'i Gerekli
Cevap değişken ismi HTTP cevabını depolamak için değişken ismi Gerekli

Eylem tipleri ve Örnekler

Algılanan Metin

  • Formatla: string
  • Örnek Sonuç: "This is a sample text detected from the image."

Kelime Düzeyinde Detaylar

  • Formatla: array of objects
  • Örnek Sonuç: [{"word": "This", "boundingBox": {"x": 10, "y": 20, "width": 30, "height": 10}}, {"word": "is", "boundingBox": {"x": 45, "y": 20, "width": 15, "height": 10}}]

Uygulama Örnekleri

Alan Kurulumu - Api key: bb3c53c6-8515-4e34-97c8-8281de60972d - Image path/url: gs://cloud-samples-data/vision/ocr/sampleimage.jpg - Base64: /9j/4AAQSkZJRgABAQEAYABgAAD/2wBDAAMCAgMCAgMDAwMEAwMEBQgFBQQEBQoHBwYIDAoMDAsKCwsNDhIQDQ4RDgsLEBYQERMUFRUVDA8XGBYUGBIUFRT/2wBDAQMEBAUEBQkFBQkUDQsNFBQUF……………./58x/8BX+R/9k= - Response variable name: getResponse

Teknik Notlar

Metin Algılama aktivitesi, OCR yetenekleri için Google Cloud Vision API'sinden yararlanır. Başarılı yürütme için, ya Image path/url ya da Base64 alanını sağlamalısınız; her ikisini birden sağlamak gerekli değildir, ancak en az biri gereklidir. Google Cloud Vision metin algılama özellikleri hakkında daha detaylı bilgi ve dokümantasyon için resmi Google Cloud Vision dokümantasyonuna bakınız.