spacer 27.03.2012 04:28 | Meine Presse Merkliste 0 Login
  • Angemeldet bleiben

Benutzerdaten vergessen?
    Neu registrieren

Culturomics: Fischzüge im „kulturellen Genom“

16.12.2010 | 18:27 |  von jürgen Langenbach (Die Presse)

Sozialforscher wollen die Kultur so systematisch erkunden wie Biologen das Genom: Maschinen durchforsten fünf Millionen digitalisierte Bücher. Es geht nicht nur um die Entwicklung der Sprache.

spacer
spacer Drucken spacer Senden Merken AAA Textgröße spacer Kommentieren

Aus dem Archiv:

  • Das Omen im Gebet (09.03.2012)
  • Sprachevolution: Vom Leben und Sterben der Wörter (02.03.2012)
  • Stöbern in alten Uhren (14.10.2011)
  • Acht Minuten Ruhm (15.09.2011)

Viel Ruhm erntet man als Wissenschaftler nicht, und Gott hat auch schon bessere Tage gesehen, zumindest was seine Erwähnung in Büchern angeht: Die hatte ihren Höhepunkt in der ersten Hälfte des 19. Jahrhunderts, seitdem sinkt sie, mit einer leichten Renaissance gegen Ende des 20. Jahrhunderts. Da war er aber schon lange von Erdenbürgern überholt: Unter deren Prominenten steigt der Ruhm rascher denn je, aber er vergeht auch rascher. Das trifft um so härter, als Ruhm immer früher kommt: Vergleicht man die 50 berühmtesten Menschen jedes Jahrgangs, wurden sie Anfang des 19. Jahrhunderts mit 43 Jahren bekannt, Mitte des 20. mit 29. Dann hängt es noch am Beruf, zumindest bei den Jahrgängen 1800 bis 1920: Schauspieler wurden mit 30 bekannt, Schriftsteller mit 40, Politiker mit 50, sie blieben (und bleiben) dann an der Spitze von allen – und erreichen mit 75 ihren Zenit –, während irgendwo weit hinten Physiker und Biologen rangieren, von Mathematikern nicht zu reden.

 

Fundus von Internetmoloch Google

Nur wenige Forscher halten sich, ganz vorn liegt Freud, abgeschlagen sind Darwin und Einstein. Diese Geringschätzung der Wissenschaft im wissenschaftlich-technischen Zeitalter gehört zu den ersten Überraschungen, die ein Konsortium von Natur- und Sozialforschern um Jean-Baptiste Michel (Harvard) aus einem Fundus zieht, den es gemeinsam mit dem Internetmoloch Google aufgebaut hat: Fünfzehn Millionen Bücher sind inzwischen digitalisiert, fünf Millionen wurden ausgewählt – das sind etwa vier Prozent aller je publizierten –, sie sollen eine ganz neue Sozialwissenschaft ermöglichen, eine, die die Geschichte der Kultur so systematisch entschlüsselt wie die Biologie die der Natur bzw. der Gene.

Deshalb heißt die Novität in Analogie zu „Genomics“ auch „Culturomics“, und wenigstens eine Parallele gibt es: Beide Wissenschaften können nicht mehr von Menschen betrieben werden, es geht auch nicht mehr um technische Hilfsmittel wie Mikroskope oder Teilchenbeschleuniger: So wie Genome von Automaten sequenziert werden, braucht auch das Kulturom maschinelle Bearbeitung: 500 Milliarden Worte umfasst es derzeit – unser Genom hat drei Milliarden Basenpaare –, aneinandergereiht würden sie zehnmal zum Mond und zurück reichen, und wenn man nur die Eingänge des Jahres 2000 lesen wollte, bräuchte man – mit raschen Augen und ohne Pause – acht Jahre.

Also müssen Maschinen das Ganze durchforsten, etwa darauf, wie sich Sprachen entwickeln: Die englische – aus ihr stammen 72 Prozent des digitalisierten Corpus – wächst, 8500 neue Wörter kommen pro Jahr dazu, 70 Prozent in den letzten 50 Jahren. Das passt in kein Lexikon, die Herausgeber müssen wählen, über die Hälfte der publizierten Wörter findet keinen Eingang, ist „lexikalisch dunkle Materie“. Aber Sprache lebt nicht nur in der Quantität, wieder im Englischen verschieben sich Verben tendenziell von irregulären (die in der Vergangenheit eine andere Form haben) zu regulären (denen ein -ed angehängt wird).

 

Wann die Eiscreme das Steak überholte

Und es geht nicht nur um die Entwicklung der Sprache, sondern auch um die der darin gespeicherten Erinnerung. Die schwindet immer rascher: Das Jahr 1880 hat seine Halbwertszeit – noch halb so viele Erwähnungen wie im Jahr 1880 selbst – 1912, nach 3

gipoco.com is neither affiliated with the authors of this page nor responsible for its contents. This is a safe-cache copy of the original web site.