Vai al contenuto

1

nocaptchaQuando si effettua un lavoro di estrazione massiva di dati da un qualsiasi sito web, come ad esempio può essere quello di pagine gialle o qualsiasi altra directory, per evitare che il proprio indirizzo IP venga rilevato come "sospetto" è necessario far uso di un IP dinamico. In questo modo non solo si protegge il proprio IP ma si evita che appaia il fastidioso "captcha" durante l"estrazione dei dati o che il proprio IP venga limitato e bloccato per un certo periodo di tempo. Per avere un IP dinamico che cambia ad esempio in automatico ogni 5 o 10 minuti, la soluzione migliore è data da un qualsiasi programma VPN. In rete esistono tanti tipi di programmi VPN, alcuni di essi anche gratuiti. Effettua una ricerca sul web e troverai tante soluzioni tra cui scegliere. Un articolo dettagliato dove viene spiegato chiaramente come si usa un programma VPN è questo: come cambiare IP dinamicamente Una volta che hai configurato il software potrai nuovamente riaprire Yellow Pages Spider e ricominciare a fare le ricerche. Oltre all'uso di un software VPN consigliamo anche di impostare (dalla prima pagina dei risultati) in basso la visualizzazione di 50 risultati per pagina e non solo 20, questo aiuterà a estrapolare più dati per ogni ricerca. Altro suggerimento: ogni volta che si conclude una ricerca ed estrazione dati, conviene riavviare sia il browser che il software Yellow Pages Spider, in modo che anche la cache e la sessione venga resettata.