Ana içeriğe geç

Veri Kazıma Aktivitesi

Veri Kazıma aktivitesi, bir Tarayıcıdan veya uygulamadan toplu bilgi alımını sağlar. Yapılandırılmış verileri yakalar ve daha fazla işleme için belirlenmiş bir veri kümesinde saklar.

Alan Açıklama Gereklilik
Uygulama adı Zaten açık veya ekli bir uygulamanın referans adını belirtir. Gerekli
Kazıyıcı adı Alınan verilerin depolanacağı veri kümesinin adını tanımlar. Gerekli
Tablo Hedef Tablo için XPath konumlandırıcısını sağlar. Gerekli
Başlık Tablonun Başlık bölümü için XPath'i belirtir. Başlık yoksa boş bırakın. İsteğe bağlı
İlk kayıt başlığı Seçildiğinde, ilk kazınan kaydı bir Başlık veya başlık olarak atar. İsteğe bağlı
Satır Tablodaki tüm Satırları temsil eden XPath'i tanımlar. Gerekli
Kolon Tablo Satırları içindeki tek tek hücreler veya tekrarlayan veri öğeleri için XPath'i belirtir. Gerekli
Reklam Varsa, bir Reklam düğmesi veya Açılır pencere için XPath konumlandırıcısını sağlar. İsteğe bağlı
Bekleme süresi (ms) Kazıma işlemi sırasında milisaniye cinsinden bekleme süresini ayarlar. İsteğe bağlı
Sonraki sayfa Tablo birden çok sayfaya yayılıyorsa, "Sonraki sayfa" düğmesi için XPath konumlandırıcısını belirtir. Bu XPath son sayfada bulunmamalıdır. İsteğe bağlı
Başlangıç açılır penceresi Bir Başlangıç açılır penceresinin tıklama eylemi için XPath konumlandırıcısını sağlar. İsteğe bağlı
Açılır pencere Sayfadaki bir Açılır pencerenin kapatma düğmesi için XPath konumlandırıcısını belirtir. İsteğe bağlı
Maksimum sayı Kazınacak maksimum veri kaydı sayısını tanımlar. İsteğe bağlı
Fare imleci True olarak ayarlandığında, her veri kazımasından sonra sayfa aşağı kaydırılır. İsteğe bağlı

Eylem tipleri ve Örnekler

Uygulama adı

  • Format: string
  • Örnek Sonuç: robustaWebpage

Kazıyıcı adı

  • Format: string
  • Örnek Sonuç: scrapeTable

Tablo

  • Format: string (XPath)
  • Örnek Sonuç: (//table[@class="unitTable"])[1]

Başlık

  • Format: string (XPath)
  • Örnek Sonuç: thead//tr//th

Satır

  • Format: string (XPath)
  • Örnek Sonuç: tbody//tr

Kolon

  • Format: string (XPath)
  • Örnek Sonuç: td

Reklam

  • Format: string (XPath)
  • Örnek Sonuç: //*[@value="Adv"]/[text()]

Bekleme süresi (ms)

  • Format: rakam
  • Örnek Sonuç: 3000

Sonraki sayfa

  • Format: string (XPath)
  • Örnek Sonuç: //*[@value="Next"]/[text()]

Başlangıç açılır penceresi

  • Format: string (XPath)
  • Örnek Sonuç: @class='siebui-popup-button']/*[@title='Pick Address:New']

Açılır pencere

  • Format: string (XPath)
  • Örnek Sonuç: @class='siebui-popup-button']/*[@title='Pick Address:New']

Maksimum sayı

  • Format: rakam
  • Örnek Sonuç: 10

Fare imleci

  • Format: boolean
  • Örnek Sonuç: true

Uygulama Örnekleri

Alan Kurulumu - Application name: robustaWebpage - Scraper name: scrapeTable - Table: (//table[@class="unitTable"])[1] - Header: thead//tr//th - Row: tbody//tr - Column: td - Advertisement: //*[@value="Adv"]/[text()] - Next page: //*[@value="Next"]/[text()] - Initial popup click: @class='siebui-popup-button']/*[@title='Pick Address:New'] - Popup: @class='siebui-popup-button']/*[@title='Pick Address:New'] - Hover: true

Uygulama Değişkenleri - Wait (ms): 3000 - Max count: 10

Teknik Notlar

WinSpy ile kazıma işlevini kullanmaya ilişkin ayrıntılı rehberlik için, WinSpy Web Tarayıcısında Kullanım dokümantasyonuna bakın.