"A journalist who is also a bad programmer, stylized in the style of Gary Larson"
Rainbow-barfing unicorn

Das Einhorn dressieren. Mehr von der „Graph Search“

Über die Frage, wie man bei Facebook sucht, habe ich ja schon eine kleine Wegbeschreibung für die ersten Schritte gebloggt („Datenkraken Pfötchen geben lassen„) – das hier soll weiterführen: Anlässlich des Zündfunk-Netzkongresses, auf dem ich einen Vortrag über Datenkraken-Dressur gesammelt habe, habe ich die vielen kleinen und großen Informationen zusammengetragen und aktualisiert.

Kleiner Spoiler: Die Informationen sind alle in ein Github-Repository gewandert.

Git-was? Github ist eine Plattform, auf der Programmierer den Programmcode für ihre Open-Source-Projekte veröffentlichen und verbessern – aber man kann sie auch nutzen, um Texte oder Informationen gemeinsam mit anderen zu verbessern. (Starthilfe für Journalist/innen gibt’s beispielsweise von der ultrakreativen Journalistin Melody Joy Kramer)

Anyway, Graph Search. Das hier erst mal, um in die richtige Stimmung zu kommen.

The Prisoner – Intro

Von wegen, keine Nummer! (Auch wenn Nr. 6 heute an den Facebook-Mitgründer Dustin Moskovitz vergeben ist.)

Facebook ist ein Haufen

Aus einem technischen Facebook-Papier zur Graph Search (über das Bild verlinkt)

Facebook ist ein großes Kuddelmuddel aus Objekten. Alles auf Facebook ist ein Objekt, ein Ding mit einer Nummer. Du, lieber Leser, der du bei Facebook bist, bist ein Objekt. Ich bin ein Objekt. (Dasjenige, das in der Datenbank unter der Nummer 10203855861709288 steht.) Mark Zuckerberg ist ein Objekt. (Nummer 4, um genau zu sein.) Genau genommen sind natürlich nicht die Menschen das Objekt, sondern ihre Profilseiten, aber das Prinzip bleibt gleich, auch für Nichtmenschliches: Unternehmen, Marken und ihre Facebook-Seiten sind Objekte. (United Nations? 54779960819.) Städte sind Objekte. (Berlin? 111175118906315.)

Das Prinzip zieht sich durch: Berufe sind Objekte. Interessen sind Objekte. Überzeugungen, politische und religiöse, sind Objekte. Nebenbei: Über die Nummer, die Objekt-ID, kann man jedes Objekt im Netz verorten und ansurfen – einfach, indem man sie im Browser-Adressfenster hinter das übliche https://www.facebook.com/ kopiert.

Das System ist nicht perfekt; manche Dinge, Orte, Arbeitgeber gibt es mehrmals bei Facebook – der WDR taucht ebenso mit Facebook-Seite auf wie die WDR-Radiowellen. Auch Orte gibt es zum Teil mehr als einmal.

Wäre Facebook nur eine Datenbank von Objekten, wäre die Plattform kein Netzwerk. Das eigentlich Spannende am sozialen Netzwerk ist aber das Netzwerk – die Beziehung zwischen den Objekten (Facebook spricht übrigens von „nodes“, Knoten, und „edges“, Kanten). Die Ur-Beziehung ist die Facebook-Freundschaft zwischen Personen, aber die Plattform versteht und speichert alle möglichen Beziehungen: zwischen einem Unternehmen und seinem Arbeitnehmer, zwischen einer Stadt und ihrem Bewohner, zwischen einer Gruppe und ihren Mitgliedern. Und Facebook weiß auch, wie stark Beziehungen sind – zum Beispiel, wie eng die Beziehung zu einer anderen Person ist (entweder, weil Facebook weiß, wie häufig wir mit dieser Person interagieren, oder einfach, weil wir es der Plattform verraten haben. „verheiratet mit…“ oder über die Sortierung in die Liste der engen Freunde oder Verwandten).

Das muss sich doch nutzen lassen, um Informationen zu finden? Das ist die richtige Einstellung.

The Unicorn Sleeps Tonight

Rainbow-barfing unicornWarum ist die Facebook-Suche eigentlich so nervig? Warum findet man manchmal Dinge nicht, von denen man weiß, dass sie da sein müssen – und die Google (über den „site:facebook.com“-Befehl zum Teil findet? Der Grund ist eine vollkommen andere Herangehensweise an das Problem „Suche“.

  • Was Google tut: die Suchbegriffe mit der Datenbank abgleichen, in der es Webseiten indexiert hat, und die Seiten ordnen, die diese Suchbegriffe enthalten – sortiert nach der Relevanz. Die versucht Google unter anderem über den Verlinkungsgrad der Seiten zu bestimmen.
  • Was Facebook tut: nach Beziehungen zwischen den erwähnten Objekten filtern.

Techniken, die Informationen aus dem „Social Graph“ fischen – dem Netz aus Objekten und ihren Beziehungen – hat Facebook schon sehr lange, 2013 führte das Unternehmen zum ersten Mal eine Technologie ein, die auch mit den Milliarden Usern des radikal gewachsenen Netzwerks klar kam: eine Suchmaschine namens „Unicorn„. Unicorn wurde, wie der Bratling im Burger, noch eingeklemmt zwischen einem Filter, der die Suchergebnisse je nach Privatsphäre-Einstellungen für den Suchenden bereinigte, und einem Parser, einem Stück Software, das normale englische Sätze in Such-Befehle übersetzte. Das alles zusammen nannte Facebook „Graph Search“.

Graph Search war ein Desaster. 2015 wurde die Suche im Rahmen einer Überarbeitung der Maschinen-Schnittstelle, der API, teilweise eingerissen. Aber, und das ist das Schöne, das Einhorn schläft nur – und lauscht im Facebook-Untergrund auf sorgfältig konstruierte Adresszeilen, so genannte URLs. Mehr dazu in meinen Folien und in der eingangs erwähnten Github-Repository.

[slideshare id=80824872&doc=zf17-graphsearch1-171015115456]

Direktlink zum Vortragsfolien-PDF, CC BY Jan Eggers (35MB!)

Auch lesenswert:


Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert