Feedly stal dit indhold - her er historien og deres kode

I sidste uge udbrød Feedly en kontroversiel ny funktion - kapring af feed links. Her er den fulde historie om hvorfor folk er vrede, og hvordan en blogger hjalp med at rette op på situationen.

I sidste uge udbrød Feedly en kontroversiel ny funktion - kapring af feed links.  Her er den fulde historie om hvorfor folk er vrede, og hvordan en blogger hjalp med at rette op på situationen.
Reklame

I sidste uge udbrød Feedly en kontroversiel ny "feature" - kapring af feed links til at stjæle trafik fra millioner af bloggere .

Omdirigering af delte links med Feedly til Feedlys egen visning af artiklen i stedet for selve artiklen på det oprindelige websted er et problem for originale indholdsskabere på mange blogs. Det resulterer ikke kun i tab af trafik, men er også vildledende for dem, der følger en bestemt blog.

Her er den fulde historie om hvorfor folk er vrede, og hvordan en blogger hjalp med at rette op på situationen. Jeg dykker også ind i deres kildekode for at vise dig, hvor snavset deres små tricks er.

Forfaldne kredit: Digital Reader var den oprindelige kilde til denne nyhed - jeg har lige besluttet at undersøge lidt længere og se præcis, hvad de var inde til.

Først de gode nyheder

På tidspunktet for skrivningen er adfærden blevet korrigeret noget, således at forkortede Feedly links sendes til originators websted, men en hurtig undersøgelse af HTTP status kode Top 10 Websites for Error Codes & Fejlfinding Top 10 Websites for Error Codes & Fejlfinding Læs mere afsløret, at omdirigeringen ikke blev gjort på det typiske serverniveau med en 301 eller 302 omdirigering (200, hvilket Feedly sender, betyder "yep, vi har den side, hold fast"; 404 betyder " ikke fundet "; 301 betyder" permanent omdirigering til en anden webadresse; mens 302 betyder "midlertidig omdirigering") .

Dette betød, at omdirigeringen blev udført i JavaScript, så jeg ønskede at vide mere. Ved hjælp af en kommandolinjens webside, der hentede værktøjet kaldet curl, kunne jeg få tag i kildekoden til en prøve Feedly-link til Techmeme.com før omdirigeringen fandt sted (da CURL ikke udfører JavaScript) - og det afslørede nogle overraskende godbidder. Her er hvad jeg fandt.

(Jeg har uploadet hele kilden her, hvis du gerne vil kigge - jeg har kun nogle interessante uddrag nedenfor)

Nogle mennesker var bekymrede for SEO-konsekvenserne af, at de grundlæggende havde deres indhold stjålet og genudgivet andetsteds; Den gode nyhed er, at Feedly korrekt sætter rel = "canonical" metataggen for at instruere Google om, at alle linkværdier skal sendes til det oprindelige websted. Det er imidlertid umuligt at fastslå, om dette blev tilføjet efter klager begyndte eller var til stede fra starten.

De er slående annoncer

I hvad der formentlig var et misforstået forsøg på at duplikere en læsbarhedstypefunktionalitet 6 bogmærker, der vil øge din websurfinghastighed og produktivitet 6 bogmærker, der vil øge din websurfinghastighed og produktivitet Bogmærker er unødvendige små hjælpere, der sidder i din browser bogmærkebjælke. I modsætning til dine almindelige bogmærker arkiverer de ikke en webadresse, snarere er bogmærker små Java-applets med et enkelt klikfunktionalitet. Der er hundreder af ... Læs mere, der striper en side ned til det vigtigste element, Feedly strippede alle reklame-, sporings- og sociale deleknapper, der måske har været indlejret i den oprindelige feedartikel. Her er den fulde liste over ting, der fjernes:

 var visualExcludePatterns = [ "feedproxy", "feedburner", "/~", "feeds.wordpress.com", "stats.wordpress.com", "googleadservices.com", "feedads", "tweet-this", "fmpub", "-ads", "_ads", "pheedo", "zemanta", "u.npr.org/iserver", "openx.org", "slashdot-it", "smilies", "/ico-", "commindo-media.de", "creatives.commindo-media", "doubleclick.net", "i.techcrunch", "adview", "/feed.gif", ".ads.", "/avw.php”, "wp-digg-this", "feed-injector", "/plugins/", "tweetmeme.com", "_icon_", "/ad-", "share-buttons", "feedsportal.com", "buysellads", "holstee", "musictapp", "/ad_", "/button/", "donate.png"", "/sponsors/", "googlesyndication.com", "/pagead", "/adx", "assets/feed-fb", "assets/feed-tw", "feedburner.com/~ff", "gstatic.com", "feedsportal.com"]; 

Udtagning af en "donate" -knap virker særligt galning, af en eller anden grund.

De er Hijacking Links

Her kommer vi til det mest seriøse punkt, for ikke bare var Feedly skrabende indholdet fra dit websted, de fjernede derefter nogle originale sociale knapper og omskrev metadataene. Dette betyder, at når nogen efterfølgende delte varen, ville de faktisk dele Feedly-linket og ikke det oprindelige indlæg . Enhver, der klikker på linket, går direkte til Feedly.

Skærmbillede af skrabet indhold fra TheDigitalReader
Skærmbillede af skrabet indhold fra TheDigitalReader

Så hvad kan du spørge? Når et indlæg går viralt, kan det være til stor gavn for det pågældende websted - øge sidevisninger og annonceindtægter og udvide deres publikum. Feedly stod direkte og stjal den særlige fordel væk fra webstedet for at udvide sin egen brugerbase. Feedly-koden omfattede kontrol af mobilenheder, som ville lede brugerne til den relevante appstore-side.

 function action( where ) { var actionName = "follow"; var url = "http://feedly.com/#" + encodeURIComponent( "subscription/" + feedInfo.id ); if( /iPhone|iPad/i.test( navigator.userAgent ) ) { actionName = "install"; url = "http://itunes.apple.com/us/app/feedly/id396069556"; } else if( /android/i.test( navigator.userAgent ) ) { actionName = "install"; url = "market://details?id=com.devhd.feedly"; } _gaq.push( [ '_trackEvent', bucket(), actionName + "." + where, feedInfo.id ] ); window.setTimeout( function() { document.location.href = url;}, 20 ); window.event.cancelBubble = true window.event.stopPropagation(); window.event.preventDefault(); } 

Det var ikke "bare at gøre artiklen nemmere at se" - den stjal trafik, ren og enkel. Det er virkelig ikke sejt.

Deres første løsning: En hardcoded ekskluderingsliste

Da Digital Reader først klagede til Feedly, var deres svar at omkode JavaScript for at inkludere en udelukkelsesliste . De bogstaveligt talt tilføjede en check til hvert Feedly-link for at se om det var et element fra Digital Reader, og i så fald at omgå siden kapringen.

 var siteExcludePatterns = [ "/TheDigitalReader/" ]; function shouldExcludeSite( url ) 

Dette er selvfølgelig en absolut latterlig måde at gøre dette på - hvis de planlægger at føje til den liste som tiden gik, og flere bloggere klagede?

Nate fra The Digital Reader svarede:

hvor står du af med at kræve, at jeg vælger din kapning? Det er som at sige, at jeg skal bede nogen om at stoppe med at slå mig i ansigtet lommebogen. Og alligevel synes du det er rimeligt?

Deres anden løsning: En hurtig Hack for at omgå al koden

Efter hvad jeg kun kan antage var overvældende antal klager, der fulgte, justerede de kapringen filter som følger:

 if( kind == "partial" || shouldExcludeSite( "http://www.techmeme.com/131202/p30#a131202p30" ) || true ) { document.body.innerHTML = ""; document.location.href = "http://www.techmeme.com/131202/p30#a131202p30"; } 

"Delvis" henviser til, at det skrabede indhold er et fuldt eller delvis feed - der er ingen mening i kapring feeds, der kun offentliggør et uddrag. Denne funktion begyndte formodentlig som den eneste check, der fandt sted, når du valgte, om du vil sende brugeren til det oprindelige websted eller ej. Du kan se den første løsning efter det, som kalder funktionen for at kontrollere, om dette websted er på listen over websteder, der har afvist men så ser vi deres endelige løsning på plads -

 || true. 

Hvis du har nogen programmeringserfaring, genkender du det hurtige hack, der siger "den følgende kode vil altid blive kørt", og den bruges normalt kun i fejlsøgning. Hvis nogen af ​​disse 3 betingelser er sande (de to første ikke længere betyder noget), omdirigerer Feedly brugerne øjeblikkeligt til det oprindelige websted.

Og så står det nu. Så hvad har vi lært?

I grund og grund gik Feedly om at skabe en slags slanket læseoplevelse, men den måde, de gik om det - omskrivning af links til at formidle deres egen service gennem efterfølgende sociale aktier var ret forbandet ulækkert. Dette er ikke det eneste dårlige træk Feedly har også lavet for nylig - i sidste måned begyndte de at logge ind med Google+ konti (efter at have set, hvor godt Google+ login virker for YouTube YouTube's kommentarafdeling nu ryddet op, hilsen af ​​Google+ YouTube's kommentarer sektion nu Ryddet op, Hilsen af ​​Google+ Google har renset YouTube med et nyt Google+ drevet kommentarsystem. Du får nu vist de mest opvokset kommentarer, dem fra personer i dine Google+ cirkler og fra ejeren af ​​videoen. Læs mere, jeg gætte), men også det blev hurtigt vendt tilbage. Lektionen er - du vil måske begynde at finde en alternativ feedreader Google Reader's End er tæt: Forbered dig på disse Alternative RSS-læsere Google Reader's End er tæt: Forbered dig på disse Alternative RSS-læsere Google Reader er død. I juli lukker internetens førende RSS-tjeneste for evigt, hvilket giver brugerne mulighed for at finde en erstatning på egen hånd. Hvis du leder efter et tilsvarende Google, er det bare ... Læs mere, medmindre du allerede var suckered til at betale $ 99 for en Pro-konto.

In this article