Feed43Leggevo ieri sull’ottimo downloadblog.it del nuovo servizio FeedYes, che permette di “fregare” da qualsiasi pagina web informazioni e ordinarle all’interno di un feed con specifiche RSS, anche se il sito in questione non ne offre in modo “nativo”.

Per chi non lo sapesse, i feed RSS sono pagine scritte secondo uno standard globalmente riconosciuto, che permettono di presentare schematicamente i dati contenuti in un numero infinito di modalità, a partire dalla visualizzazione in stile “Outlook” (una news in ogni riga, con quelle nuove in grassetto e così via: svolge questa funzione l’eccellente software gratuito FeedReader, che ci avverte con piccoli avvisi delle nuove news appena arrivate, è comodissimo), fino alla divertente presentazione dei dati in stile “news ticker”, tipo le notizie che scorrono in fondo allo schermo nel TG2, su CNN o su SkyTG24 (RSSNewsTicker ne è un esempio).

Ho provato FeedYes, è molto semplice da usare e quasi completamente automatico: basta inserire l’indirizzo della pagina web da cui trarre le notizie e il programma utilizzato dal sito cattura tutti i link presenti, esclude quelli che presumibilmente non sono “rappresentativi” (ad esempio se inseriamo una pagina di un forum esclude i link alle singole pagine dei singoli topic, che sono essenzialmente delle ripetizioni) e poi ci chiede di escluderne eventualmente altri, come quelli fissi della pagina (i link per effettuare il login, quelli degli eventuali menu, ecc) o altri non di interesse a livello di news. Il risultato è un po’ discutibile però: spesso FeedYes si sbaglia e ci propone come news parti della pagina che non fanno parte della sezione che ci interessa: proprio con un test che ho fatto su un forum, spesso prendeva comunque i link ai profili degli autori, mentre desideravo che apparissero solo quelli ai singoli thread. Si può dire che è buono, ma proprio perchè un po’ troppo automatico, allo stesso tempo è troppo approssimativo.

Per chi desidera risultati migliori, ha voglia di passare un quarto d’ora per la configurazione e capisce un minimo l’HTML, consiglio Feed43: meno automatico, chiede di inserire l’url da cui trarre le news e poi di definire un “pattern”, cioè un modello di ricerca da applicare al codice della pagina, in modo da delimitare le varie news e addirittura delimitare all’interno di esse i vari campi: il link, il titolo, la descrizione (o sottotitolo, se vogliamo). Ed è così che con un pattern relativamente semplice come:

Pattern Feed 2

sono riuscito ad ottenere un perfetto feed RSS della pagina con l’elenco dei topic di un forum basato su piattaforma Invision, in cui ogni news è presentata dal titolo del singolo thread, il link è direttamente alla pagina del thread stesso e la descrizione è il sottotitolo (se presente).

EDIT: Feed43 è un servizio gratuito, anche se prevedono di varare una versione “premium” in futuro. La versione gratuita prevede attualmente l’aggiornamento dei feed ogni 6 ore.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.