“La tecnologia di web scraping non è solo per le aziende, ma anche per risolvere problemi sociali” afferma Juras Juršėnas

“La tecnologia di web scraping non è solo per le aziende, ma anche per risolvere problemi sociali” afferma Juras Juršėnas

di Trend di mercato 25 novembre 2022

Per oltre sette anni, Oxylabs è stato il fornitore di riferimento di proxy premium e soluzioni di raccolta dati web pubbliche, aiutando le aziende di tutte le dimensioni a sfruttare il potenziale dei big data. Juras Juršėnas, direttore operativo di Oxylabs, con oltre 16 anni di esperienza nel settore, si è affermato come esperto di IT e product management. La sua capacità di applicare la risoluzione strategica dei problemi, il pensiero critico e le capacità di gestione delle persone lo hanno portato ad occupare la posizione di COO presso Oxylab, un fornitore globale leader di proxy premium e soluzioni di scraping di dati Web pubblici. La routine lavorativa di Juras ruota attorno alla gestione dell’innovazione, che spesso include fare qualcosa che non è mai stato fatto prima. È appassionato di tecnologia e delle possibilità che offre. In un’intervista esclusiva con Analytics Insight, Juras ha condiviso il suo punto di vista sull’azienda, i suoi risultati, le sfide e il futuro del settore del web scraping etico.

1. Gentilmente informaci sull’azienda, sulla sua specializzazione e sui servizi offerti dalla tua azienda.

Oxylabs è il principale fornitore di strumenti e soluzioni per la raccolta di dati web pubblici su larga scala. Fornire un’infrastruttura per il web scraping etico è parte integrante delle nostre operazioni quotidiane.

Sono entrato in azienda quasi quattro anni fa e fino ad oggi è affascinante far parte del team Oxylabs. A mio parere, il nostro impegno consapevole per l’innovazione e l’etica ci consente di distinguerci dal resto della concorrenza. È gratificante lavorare con tutti i nostri partner commerciali, siano essi aziende Fortune Global 500 o startup che cercano di essere i prossimi unicorni. Ti preghiamo di informarci sui prodotti/servizi/soluzioni che fornisci ai tuoi clienti e su come ottengono valore. Forniamo strumenti e soluzioni per le aziende che desiderano raccogliere dati pubblicamente disponibili su larga scala. Il nostro catalogo di prodotti include proxy e soluzioni di raccolta dati Web pronte all’uso, come le API Scraper.

I nostri tipici clienti dell’infrastruttura proxy sono grandi aziende con risorse interne per eseguire le loro attività di web scraping. Hanno solo bisogno della nostra vasta infrastruttura di rete proxy per distribuire la loro richiesta di dati o ottenere dati geolocalizzati specifici. Altre aziende scelgono strumenti pronti all’uso come API raschietto perfetti per le aziende che preferiscono lavorare sull’analisi dei dati invece di impegnarsi nell’acquisizione dei dati. La soluzione è composta da tre prodotti distinti: E-commerce Scraper API, SERP Scraper API e Web Scraper API, ciascuno progettato per raccogliere dati Web pubblici da diverse fonti su Internet. Il processo semplificato è particolarmente vantaggioso per le aziende più piccole per raggiungere i risultati più velocemente e rimanere competitivi sugli approfondimenti commerciali con le grandi aziende.

Il web scraping è ampiamente utilizzato nell’e-commerce. Le aziende di e-commerce raccolgono dati per ricerche di mercato, analisi della concorrenza, tentativo di comprendere il sentimento dei consumatori e prevedere quali beni saranno di tendenza.

Le società finanziarie utilizzano anche il web scraping per analizzare e valutare le imprese e trovare nuovi clienti. Queste aziende dipendono dalla tecnologia per la gestione del rischio e la due diligence.

Nel frattempo, per alcune aziende, il web scraping è la base delle loro operazioni. Ad esempio, gli aggregatori di tariffe di viaggio e i siti Web di confronto dei prezzi si affidano a questa tecnologia.

Per riassumere, disponiamo dell’infrastruttura di rete proxy più estesa e della gamma più diversificata di indirizzi IP di vari paesi e città. Mentre le nostre soluzioni pronte all’uso forniscono facilmente dati Web ai nostri clienti.

2. Qual è il tuo più grande USP che differenzia l’azienda dai concorrenti?

Come accennato, ci impegniamo molto nella ricerca e nello sviluppo. Abbiamo riunito un comitato consultivo AI/ML di cinque leader del settore e accademici, tra cui Stripe ed ex rappresentanti del MIT/NASA. Il consiglio di amministrazione assiste Oxylabs nei processi di sviluppo del prodotto, spingendo i confini della tecnologia etica di web scraping.

Siamo molto orgogliosi del fatto che il nostro team sviluppi costantemente nuove soluzioni. Come risultato dei nostri sforzi, teniamo decine di brevetti per le nostre soluzioni e infrastrutture. Il web scraping non è una tecnologia semplice e spesso accadono cose inaspettate. I web scraper si rompono e le pipeline di analisi incontrano problemi a causa dei layout dei siti Web in continua evoluzione. Quindi, fin dal primo giorno, abbiamo consapevolmente enfatizzato l’innovazione per eliminare tutti i blocchi stradali sullo sfondo. Un altro USP riguarderebbe il nostro approccio etico a tutto ciò che facciamo. Ad esempio, l’approvvigionamento di deleghe residenziali. Questi proxy reindirizzano il traffico Internet attraverso dispositivi fisici di proprietà di persone reali. Per implementare un modello di pratica leale, gli utenti devono fornire un consenso registrato ed esplicito e, se possibile, i partecipanti alla rete devono essere compensati. Bene, questa è la nostra posizione. Purtroppo, molte aziende abilitano metodi che rendono le persone inconsapevoli che il loro dispositivo è un proxy attivo (nodo di uscita) per una terza parte.

Per garantire l’implementazione di un modello di pratica leale, abbiamo creato a Modello di livello A+ che contrassegna tutti i controlli di correttezza: garantire il consenso esplicito e informare e premiare completamente gli utenti per la partecipazione alla rete proxy. Menziona alcuni dei premi, risultati, riconoscimenti e feedback dei clienti che ritieni importanti e preziosi per l’azienda.

Vediamo una crescente necessità di mostrare quanto la tecnologia di web scraping sia fondamentale non solo per le aziende, ma anche per risolvere i problemi sociali. Pertanto, abbiamo avviato un nuovo programma pro bono chiamato Progetto 4ß come parte di questi sforzi. Attraverso 4ß, Oxylabs offre know-how tecnico gratuito, infrastruttura di raccolta dati web pubblica e risorse su base pro-bono al mondo accademico e alle istituzioni senza scopo di lucro.

Ad esempio, dopo aver vinto la Govtech Lab Challenge, Oxylabs ha collaborato con RRT – un’organizzazione lituana che sovrintende ai settori elettronico, postale e ferroviario della Lituania. Protegge Internet da informazioni illegali e pericolose. La sfida consisteva nell’automatizzare l’identificazione di contenuti illegali, in particolare relativi ad abusi sessuali su minori o pornografia, nello spazio degli indirizzi IP lituani. Oxylabs ha prodotto a strumento specializzato unico nel suo genere che RRT aveva integrato nelle loro operazioni regolari all’inizio del 2022.

Dal punto di vista degli affari, Oxylabs è stato chiamato Proxyway’s miglior fornitore di proxy per alcuni anni consecutivi. Inoltre, nel 2022 siamo stati riconosciuti dal Financial Times come fornitore di acquisizione di dati web pubblici in più rapida crescita in Europa. Questi riconoscimenti non sarebbero possibili senza la dedizione dei nostri fantastici 400 dipendenti per raggiungere nuove vette, enormi complimenti a loro.

3.Si prega di menzionare alcune delle principali sfide che l’azienda ha dovuto affrontare fino ad ora.

Di solito ci vuole molto lavoro per sviluppare soluzioni di web scraping. Essere un pioniere è una sensazione incredibile ma rende i compiti molto più impegnativi. Essere un favorito implica stabilire il ritmo e impegnarsi. Implica che molte altre aziende ci ammirino ed emulino i modelli che sviluppiamo.

Siamo soddisfatti nell’aiutare i clienti a mantenere un flusso ininterrotto di dati. Supportare l’infrastruttura, la scrittura, lo scraping del codice e tutto il resto richiede risorse. Con la crescente novità del settore, ci confrontiamo costantemente con problemi emergenti.

Inoltre, il web scraping deve ancora prendere piede nella coscienza pubblica. Fino ad oggi, c’è poca legislazione in vigore in tutto il mondo.

Quindi, per continuare a salvaguardare la nostra industria dall’interno, insieme ad altre quattro organizzazioni, abbiamo istituito un Associazione Etica Raccolta Dati Web. L’EWDC rappresenta gli interessi delle aziende che si affidano alla tecnologia di web scraping.

Il nostro obiettivo è riunire queste aziende e sostenere le migliori pratiche, contribuire allo sviluppo di standard di settore e sensibilizzare il pubblico su quanto sia cruciale la tecnologia di web scraping sia per le aziende che per i consumatori.

4. Dove vedi la crescita in arrivo per il settore?

Sebbene esistano settori consolidati come l’e-commerce e la finanza, esistono anche nuovi modi per utilizzare i dati raccolti. La maggior parte dei dati proveniva da fonti interne in passato, con alcuni fornitori esterni che completano il quadro. Di recente, tuttavia, c’è stato uno spostamento verso lo scraping online come metodo principale per automatizzare la raccolta di dati alternativi.

L’industria dei dati alternativi vale quasi $ 3 miliardi. Tuttavia, l’industria è ancora in una fase nascente. Nel nostro nuovo ricercaabbiamo notato la tendenza di una domanda sempre crescente di dati pubblici per ottenere approfondimenti e rimanere pertinenti.

We want to say thanks to the writer of this article for this remarkable material

“La tecnologia di web scraping non è solo per le aziende, ma anche per risolvere problemi sociali” afferma Juras Juršėnas


Discover our social media profiles as well as the other related pageshttps://lmflux.com/related-pages/