Ein Tag im Leben eines Content-Analysten

Es gibt bei Kaspersky Lab eine Arbeitsstelle, die offiziell als „Content-Analyst“ bezeichnet wird. Einfach gesagt, ist seine Aufgabe, die Inhaltsfilterdatenbank zu pflegen, die in unseren Produkten zum Einsatz kommt. Die Filter sind sowohl in den Lösungen für Heimanwender, als auch in den Unternehmensprodukten zu finden. Eines der Programm-Module, das für die Inhaltsfilterung zuständig ist, ist die Kindersicherung in den Heimanwenderprodukten, ein anderes ist die Web-Kontrolle bei den Unternehmenslösungen.

Content-Analyst

Es gibt bei Kaspersky Lab eine Arbeitsstelle, die offiziell als „Content-Analyst“ bezeichnet wird. Einfach gesagt, ist seine Aufgabe, die Inhaltsfilterdatenbank zu pflegen, die in unseren Produkten zum Einsatz kommt. Die Filter sind sowohl in den Lösungen für Heimanwender, als auch in den Unternehmensprodukten zu finden. Eines der Programm-Module, das für die Inhaltsfilterung zuständig ist, ist die Kindersicherung in den Heimanwenderprodukten, ein anderes ist die Web-Kontrolle bei den Unternehmenslösungen. Mit den Funktionen der Kindersicherung können Eltern den Zugriff ihrer Kinder auf unerwünschte Webseiten sperren. Um diese Filter anzuwenden, muss das Programm natürlich wissen, in welche Kategorie eine bestimmte Webseite einzuordnen ist und welche Inhalt darauf zu finden sind. Dabei kommt die Datenbank ins Spiel.

Doch die Pflege der Filterdatenbank per Hand ist unmöglich, denn laut Google enthält das Internet heute ungefähr 15 Milliarden Webseiten, so dass ein Großteil der Seitenprüfung automatisch durch so genannte Robots durchgeführt wird. Sie analysieren die Inhalte anhand unserer KSN-Cloud und erzeugen automatisch ein Urteil zu der geprüften Seite. Die Entscheidung, die in der Cloud gefällt wird, wird sowohl in unseren mobilen Sicherheitslösungen (inklusive dem Safe Browser für iOS), als auch in allen anderen Produkten genutzt, um Inhalte mit den entsprechenden Programmkomponenten filtern zu können. Die Aufgabe des Analysten ist, die Robots entsprechend anzuleiten, damit diese die Internetinhalte richtig kategorisieren können. Ein Robot muss Stichworte und deren Kombinationen auf Webseiten und in Bildern bewerten, und ein Urteil darüber fällen, ob der Inhalt einer Webseite in eine bestimmte Kategorie fällt. Wenn der Code einer Seite zum Beispiel Wortkombinationen wie „watch porn online“, „free porn“ oder eine große Zahl Bilder mit viel hautfarbigem Anteil oder ähnliche Dinge enthält, würde ein Robot diese Seite aufgrund der gesetzten Kriterien als „Pornographie und Erotik“ einstufen.

Die Aufgabe des Analysten ist, die Robots anzuleiten, Internetinhalte richtig zu kategorisieren

Als Teil der Arbeit müssen die Content-Analysten hin und wieder auch selbst „unpassende Inhalte“ überprüfen. Wir arbeiten mit vielen Kategorien, inklusive einiger höchst gefährlicher:

  • Drogen
  • Grausamkeit und Gewalt
  • Waffen
  • Glücksspiel
  • Obszöne Sprache

Eine Regel ist, dass die oben genannten Kategorien in der Standardeinstellung als durch den Administrator gesperrt eingestellt sind, sobald die Kindersicherung oder die Web-Kontrolle aktiviert werden.

So wie die Inhalte, sind auch die Analysten unterschiedlich. Der eine ist mehr, der andere etwas weniger psychologisch widerstandsfähig, kann sich von bestimmten Gefühlen absondern und einen gesunden Zynismus behalten, um in der Kategorie „Grausamkeit und Gewalt“ zu arbeiten. Diese persönlichen Qualifikationen werden ausdrücklich vorausgesetzt, wenn sich jemand auf die Stelle eines Content-Analysten bewirbt.

Aber das ist natürlich nicht das Einzige, was man in diesem Job zu tun hat… Es ist schwer, den Arbeitsprozess zu erklären und all die Besonderheiten der Suche nach den schlimmsten Inhalte des Internets im Detail zu beschreiben, doch generell sieht der Arbeitstag eines Content-Analysten so aus:

Morgendliches E-Mail-Lesen

  • Mir persönlich hilft das, in Arbeitslaune zu kommen und die Arbeit des Tages abzuschätzen.

Status-Besprechung

  • Jeden Tag um 11 Uhr Vormittags trifft sich das gesamte Team und spricht über alles, das am Vortag gemacht wurde, sowie über die Aufgaben des neuen Tages. Das ist ein wichtiger Teil des Arbeitsprozesses, der dabei hilft, die Disziplin, aber auch die Transparenz im Team zu wahren.

Kaffeepause

  • Die Arbeit ist wichtig, aber wer kann sie schon machen, ohne eine morgendliche Tasse Kaffee!

Nutzeranfragen

  • Täglich erhalten unsere Support-Kollegen Anfragen von Anwendern zu fälschlichen Blockierungen von Webseiten durch die Inhaltsfilter. Solche Anfragen werden an uns weitergeleitet, und wir analysieren die entsprechenden Seiten, bearbeiten die Datenbank und geben dem Anwender eine Rückmeldung. Wir kümmern uns auch um Fehlfunktionen der Anti-Banner-Module unserer Produkte. Offiziell dauert es bis zu drei Werktage, bis eine Anfrage beantwortet wird, doch wie immer ist schneller natürlich besser.

Arbeit an den Inhaltskategorien

  • Der größte Teil der Arbeit eines Content-Analysten ist, neue Kategorien zu erstellen und die bestehenden zu pflegen. Unsere Datenbank enthält derzeit 15 Kategorien und 7 Sprachen. Deshalb ist es so wichtig, dass Bewerber für diese Position neben Englisch eine zweite Fremdsprache beherrschen. Wir freuen uns über Bewerber mit einem Abschluss in Philologie oder Linguistik, sowie – und das sollte natürlich klar sein – mit analytischem Denken. Kurz, der Bewerber muss eine „Kunst-und-Mathematik“-Person sein, was nicht so oft vorkommt.

Live-Test

  • Wenn Inhalte kategorisiert werden, nutzen die Robots Datenbanken, die von Content-Analysten erstellt und gepflegt werden. Natürlich werden die Datenbanken vor der Veröffentlichung in einigen Tests geprüft. Der wichtigste ist der Live-Test, bei dem echte Webseiten verwendet werden. Dieser Test wird mehrmals täglich durchgeführt. Eine Liste der populärsten globalen Webseiten wird jeden Morgen erstellt, wobei Seiten, die bisher nicht in unserer Testliste waren, an die Analysten zur Kategorisierung geschickt werden. Die Analysten bewerten diese neuen Seiten und aktualisieren den Test per Hand. Dadurch wird sichergestellt, dass die Kategorien, die von den Robots für Webseiten festgelegt werden, mit den dafür von den Analysten festgelegten Kategorien übereinstimmen. Da sich der Inhalt von Webseiten ändern kann, müssen wir laufend an diesem Test arbeiten. So starten wir dreimal täglich einen Live-Test: am Morgen, am Nachmittag und am Abend. Zudem arbeiten wir in Schichten daran.

Aufklärung

  • Die Mitarbeiter unserer Abteilung sind bekannte Experten, wenn es um den Schutz von Kindern vor unpassenden Inhalten im Internet geht. Sie schreiben Artikel sowie Blog-Beiträge, geben Interviews und werden als Sprecher auf Konferenzen eingeladen.
  • Doch egal, wie viele Artikel, Vorträge oder Interviews es schon gegeben hat, der Schutz von Kindern vor unpassenden Inhalten ist immer noch ein wichtiges Thema.

Natürlich gibt es Millionen von Möglichkeiten, Seiten mit unpassenden Inhalten zu finden und eine Kindersicherung oder Web-Kontrolle ist nicht idiotensicher. Doch wir tun unser Bestes, unsere Kunden, ihre Familien und Kollegen vor unpassenden oder gefährlichen Internetinhalten zu schützen.

Tipps