Biologische Speichertechnologien

Aus Winfwiki

Wechseln zu: Navigation, Suche

1 Titel

Namen der Autoren: Damian Wolgast, Sascha Ewert
Titel der Arbeit: "Biologische Speichertechnologien"
Hochschule und Studienort: FOM Essen


2 Inhaltsverzeichnis

Inhaltsverzeichnis

3 Abbildungsverzeichnis

Abb.-Nr.Abbildung
1Winglet am Tragflächenende
2DNA in der Vergrößerung
3Transkription durch RNA-Polymerase
4Virus (Phage)
5Modell eines Chips der Daten in DNA Ketten speichert
6Schlüssel-Schloss-Prinzip
7Struktur von Bakteriorhodopsin
8Fokussierung des Lasers auf eine Ebene am Beispiel der DVD
9Sukzessive DNA Verkettung zur Lösung des Rucksackproblems
10Eisenatome in organischem Gitter
11Polarisationsrichtungen
12Datenschicht; Einbettung von BR in eine Membran
13Ausweis mit Bundesadler als Sicherheitsmerkmal
14"Datenfenster" auf Ausweis mit gespeichertem Bild
152D Barcode
16Permanentes, optisches Beschreiben eines BR Datenfeldes

4 Tabellenverzeichnis

Abb.-Nr.Abbildung
1Proteingruppen und deren Aufgaben
2Zur Auswahl stehende Objekte und deren Eigenschaften

5 Einleitung

Die Weiterentwicklung von Dampfmaschinen leitete ab 1850 den Beginn des Industriezeitalters ein. Ähnlich verhält es sich mit der Entstehung immer größerer Kommunikationsnetzwerke ab den 1970er Jahren, die die Überleitung der Gesellschaft in das Informationszeitalter prägten. Von zentraler Bedeutung für Wirtschaft und Gesellschaft sind in diesem Zeitalter Informationen. Sie werden als immaterielles Handelsgut verstanden und sind die Basis vieler Geschäftsmodelle. Im Zuge der steigenden Informationsmenge werden immer neue Verfahren entwickelt, diese zu verarbeiten und zu speichern. Dabei stößt die Wissenschaft jedoch immer wieder auf physikalische und technologische Grenzen.
In diesem Zusammenhang forschen diverse Einrichtungen an alternativen Computingkonzepten, aus denen neue Architekturen mit verbesserten Eigenschaften hervorgehen sollen. Computingkonzepte beschreiben nutzbare Prinzipien der Natur (speziell aus dem Bereich der Biologie), die das Ausführen von Rechenvorgängen und das Speichern von Informationen ermöglichen. Zurzeit existieren in diesem Bereich zusammengefasst unter dem Begriff Future Computing die Ausprägungen Quantum Computing, Neural Computing, Evolutionary Computing und das Molecular Computing.[1]
Im vorliegenden Dokument steht der Bereich Molecular Computing, dem aktuell das größte Potenzial zugerechnet wird, im Vordergrund. Das Ziel dieser Fallstudie ist es den aktuellen Stand der Forschung und Technik sowie zukünftige Entwicklungsrichtungen aufzuzeigen.
Zunächst werden mit Biologie, Speichertechnologie und Bionik wesentliche Begriffe aus dem Bereich der biologischen Speichertechnologien definiert. Darauf aufbauend werden Verfahren beleuchtet, um mit Hilfe von DNA oder Proteinen Speichertechnologien zu entwickeln. Auf Basis der dort gewonnenen Erkenntnisse werden nachfolgend konkrete Anwendungsbeispiele und Prototypen vorgestellt. Zum Abschluss wird kritisch betrachtet, ob die Konzepte aus dem Bereich des Molecular Computing in naher Zukunft bisherige Speichertechnologien verdrängen und die Datenspeicherung revolutionieren könnten.

6 Grundlagen

Das folgende Kapitel beschäftigt sich mit Begriffsdefinitionen und der Abgrenzung des Themas zu ähnlichen Bereichen. Zudem werden Anforderungen definiert, die die Grundlage für die in diesem Dokument vorgestellten Technologien darstellen.

6.1 Begriffsdefinitionen und Abgrenzung

Der Begriff Speichertechnologie beschreibt im weiten Sinne jede Technologie, die zur Speicherung von bestimmten Dingen geeignet ist. In dieser Fallstudie werden Speichertechnologien behandelt, die sich direkt oder indirekt zur Speicherung von digitalen Daten eignen. Elementare Eigenschaften und wichtige Voraussetzungen für Speichertechnologien werden im Kapitel Anforderungen an eine Speichertechnologie näher betrachtet.
Weiter eingegrenzt wird der Begriff der Speichertechnologie im vorliegenden Dokument durch den Vorsatz biologisch. Die Biologie ist die Wissenschaft von den Lebewesen. Diese heben sich durch einige Merkmale von der unbelebten Materie ab. Als elementare Eigenschaften des Lebens gelten "der Aufbau aus Zellen, Eigenbewegung, Reizbarkeit, Stoffwechsel, Wachstum, Entwicklung und Tod, sowie Fortpflanzung und Vererbung"[2]. Abweichend von dieser Definition wird der Begriff biologische Speichertechnologie in dieser Fallstudie weiter gefasst und um den Bereich der Bionik erweitert.
Die Bionik befasst sich mit dem Lernen aus biologischen Systemen und der Nutzbarmachung des Erlernten in Technologien. Das heißt, biologische Systeme werden systematisch darauf untersucht, wie in der Natur spezielle Probleme gelöst wurden. Anschließend wird versucht, die Problemlösungen auf die technische Problemstellung zu übertragen. Dabei geht es nicht nur um vollständige Neuentwicklungen sondern auch um Detailverbesserungen.[3]
Abb.: 1 Winglet am Tragflächenende
Abb.: 1 Winglet am Tragflächenende
Als Beispiel können hier so genannte Winglets aus dem Bereich der Luftfahrt angeführt werden (siehe Abbildung 1). An den Spitzen von Flugzeugtragflächen bilden sich Luftwirbel. Diese stören die Aerodynamik und erhöhen den Treibstoffverbrauch. Bei gleitenden Vögeln wie dem Kondor können an den Flügelspitzen Spreitzfedern beobachtet werden. Diese reduzieren effizient die störenden Wirbel. Der aerodynamische Effekt lässt sich durch die Nutzung von Winglets an den Tragflächenenden auch auf Flugzeuge übertragen.[4]
Diese Fallstudie beschäftigt sich demnach mit Speichertechnologien, die auf Erkenntnissen aus der belebten Natur beruhen. Die aus diesen Erkenntnissen entwickelte Speichertechnologie muss aber keineswegs, wie der Titel vermuten lassen würde, ein Lebewesen sein. Ein lebendiger Datenspeicher wie man ihn aus zahlreichen Filmen kennt ist, zumindest nach heutigem Forschungsstand, bisher nicht zu realisieren. Ansätze, die in diese Richtung gehen, gibt es dennoch wie das Kapitel Langzeitspeicherung von Daten in Bakterien zeigen wird. Dabei handelt es sich jedoch nicht um eine reine Speichertechnologie, sondern um die Ausnutzung bestimmter Merkmale einfacher Organismen.

6.2 Anforderungen an eine Speichertechnologie

Eine Speichertechnologie muss in der Lage sein, Daten über einen gewissen Zeitraum aufnehmen und in unveränderter Form wieder abgegeben zu können. In der Regel werden digitale Daten in binärer Form gespeichert. Das bedeutet, dass die Speichertechnologie eine Struktur bereitstellen muss mit deren Hilfe zwei Zustände dauerhaft dargestellt werden können. Zusätzlich müssen die abgespeicherten Daten wieder auffindbar sein. Das heißt, dass die Datenablage nach einem strukturierten Prinzip erfolgen muss. Dazu werden die einzelnen Speicherzellen im Speichermedium üblicherweise nach einem vordefinierten Muster angeordnet.
In dieser Fallstudie werden auch Speichertechnologien vorgestellt, die mehr als zwei Zustände zur Datenspeicherung verwenden. Für diese gelten jedoch die gleichen Anforderungen.
Magnetische Verfahren zur Datenspeicherung beispielsweise nutzen die ferromagnetischen Eigenschaften bestimmter Materialien um binäre Zustände zu speichern. Dabei ist definiert, welche Ausrichtung des Magnetfeldes welchen binären Zustand repräsentiert. Ähnlich verhält es sich bei optischen Verfahren. Anstelle von ferromagnetischen Eigenschaften verwenden diese Speichertechnologien die optischen Eigenschaften von Materialien. Die binären Zustände werden hier meist über Lichtbrechung oder Farbveränderung definiert.

Weitere Anforderungen an eine Speichertechnologie ergeben sich aus der Anwendungspraxis. Hier spielen folgende Anforderungen eine wichtige Rolle:

  • Datensicherheit
  • Lebensdauer der Datenträger
  • Zugriffszeit
  • Übertragungsrate
  • Zugriffsart (zum Beispiel optisch)
  • Handhabbarkeit

Je nach Einsatzzweck ist die Ausprägung der jeweiligen Anforderungen verschieden.

7 DNA

Die Desoxyribonukleinsäure (DNS bzw. deoxyribonucleic acid, DNA) wurde 1869 als Zellbestandteil entdeckt und ist neben der Ribonukleinsäure (ribonucleic acid, RNA) der Träger der Erbinformationen. Zusammen mit Proteinen und Nukleinsäuren bildet die DNA die Chromosomen. Alle Chromosomen einer Zelle zusammengefasst werden als Genom bezeichnet.[5] Im Prinzip eignen sich sowohl RNA als auch DNA zur Speicherung von Erbinformationen. Da die DNA jedoch eine höhere Molekülstabilität als die RNA aufweist, ist sie das bevorzugte Mittel der Informatik zur Speicherung von Daten.[6]

7.1 Aufbau

Abb.: 2 DNA in der Vergrößerung
Abb.: 2 DNA in der Vergrößerung
DNA gehört zur Gruppe der Nukleinsäuren, die aus strangartigen Molekülen bestehen und sich aus einzelnen Bausteinen (Monomeren) zusammensetzen, weshalb sie als Polymere bezeichnet werden. Die einzelnen Nukleinsäuren (DNA, RNA) unterscheiden sich durch die zugrunde liegenden Monomere und den daraus resultierenden chemischen Verbindungen.[7]
DNA besteht zu gleichen Anteilen aus Desoxyribose (einer Zuckerart), Phosphorsäure und den Basen Adenin (A), Guanin (G), Thymin (T) und Cytosin (C). Adenin und Guanin gehören zur Untergruppe der Purinbasen, Thymin und Cytosin zur Gruppe der Pyrimidinbasen. Die Hydroxylgruppen (OH-) an den Kohlenstoffatomen 1', 3' und 5' der Desoxyribose können Sauerstoffbrücken zu anderen Molekülen bilden und die Phosphorsäure kann Bindungen zu OH--Gruppen herstellen. An die 1' Bindungsstelle des Kohlenstoffatoms ist die Base kovalent (Bindung durch elektrostatische Anziehung) gekoppelt. Bindungsstelle 3' und 5' des Kohlenstoffatoms erlauben jeweils die Verbindung zu einer weiteren Desoxyribose, so dass eine Kette entsteht. Auf Grund der räumlichen Trennung und der durch die Umgebung bedingten chemischen Struktur der 3' und 5' Bindungsstelle sind diese voneinander unterscheidbar. Daher besitzen DNA-Stränge eine bestimmte Richtung, die in 5'-3' Richtung mit sense und in 3'-5' Richtung mit antisense bezeichnet wird. Die Anzahl der Adenin- und Thyminmoleküle, sowie die der Guanin- und Cytosinmoleküle ist immer gleich. Die Grundbausteine der DNA, die sogenannten Nukleotide (kleinste informationstragende Einheit, A, C, G oder T), fügen sich aus einer Phosphatgruppe und einer organischen Base zusammen. Da die DNA aus mehreren Millionen Nukleotiden besteht, wird sie auch als Polynukleotid bezeichnet. [8]
Die DNA bildet zwei einzelne Stränge wie im unteren Bereich der Abbildung 2 zu sehen ist. Die beiden Stränge sind umeinander gedreht und bilden eine Doppelhelix, deren Außenseite aus verketteten Zucker- und Phosphatgruppen besteht. Dieser Helixstrang wird mehrfach aufgewickelt und formt letztendlich ein Chromosom wie im oberen Bereich von Abbildung 2 zu sehen ist. Die Basen zeigen dabei stets in das Innere der Doppelhelix. Dabei liegen sich die komplementären Basen A und T bzw. G und C gegenüber, da sie sich aufgrund ihrer Ladungsverteilung anziehen.
Die Doppelhelix weißt eine hohe Stabilität auf, da ihre beiden Einzelstränge auf Grund der vielen Wasserstoffbrückenbindungen nicht leicht voneinander zu trennen sind. A und T formen zwei, G und C drei lockere Wasserstoffbrückenbindungen. Diese Basenpaarung erklärt auch das gleiche Mengenverhältnis der Purin- und der Pyrimidinbasen in der DNA. Die beiden Einzelstränge liegen antiparallel zueinander, da die komplementären Basen nur dann Basenpaare bilden können.
In einem Virus kann die gesamte Länge der DNA 50 mm betragen. In jeder einzelnen menschlichen Zelle beträgt sie ca. 1,8 m, was in etwa 6 Milliarden Basenpaaren entspricht.

[5]

7.2 Funktion

Die DNA kodiert Erbinformationen (Baupläne) zur Herstellung von Proteinen. Benötigt eine Zelle ein neues Protein, wird der Doppelstrang der DNA geöffnet und nach dem für die Produktion notwendigen Gen abgesucht. Die Stelle, an der sich der Bauplan befindet, wird dann von Markerproteinen markiert. Das Ablesen und Kopieren des Stranges geschieht durch das Enzym Polymerase. Die gesuchte Sequenz wird durch die RNA-Polymerase in einen RNA-Strang (mRNA) kopiert (siehe Abbildung 3). Dieser Vorgang nennt sich Transkription. Sofern der Träger einen Zellkern besitzt, wird der kopierte Abschnitt anschließend aus dem Kern heraus an das Protein Ribosom übergeben. Besitzt die Zelle keinen Zellkern, kann das Protein Ribosom direkt den im kopierten Einzelstrang enthaltenen Bauplan einlesen und anhand dessen das Protein herstellen. Jeweils drei aufeinander folgende Basenpaare der DNA kodieren eine Aminosäure. Daher arbeitet sich das Ribosom in Dreierschritten an den Basenpaaren entlang. Dieser Vorgang wird Translation genannt. Das fertige Protein steht der Zelle danach zur Verfügung.
Abb.: 3 Transkription durch RNA-Polymerase (RNA-Polymerase blau/grün, Quell-DNA orange, mRNA rot)
Abb.: 3 Transkription durch RNA-Polymerase (RNA-Polymerase blau/grün, Quell-DNA orange, mRNA rot)
Wie genau der gesamte Vorgang abläuft ist noch nicht genau erforscht und wurde in diesem Kapitel stark vereinfacht beschrieben. [9][10]
In der menschlichen Zelle werden circa 3% der vorhandenen DNA-Kapazität genutzt, um die Bauplaninformationen abzulegen. Da die gegenseitigen Abhängigkeiten innerhalb der DNA noch nicht genau bekannt sind, stehen allerdings nicht die vollen freien 97% der Kapazität zur Speicherung von Daten zur Verfügung.[11]

7.3 Geeignete DNA-Träger

Die DNA gilt als ein äußerst stabiles Molekül. Dennoch ist auch sie dem Zerfall unterworfen. Daher ist eine Datenspeicherung in der DNA zunächst auf die Lebensdauer der DNA an sich beschränkt. In der Natur wurde das Problem gelöst, indem sich die DNA mindestens einmal in jeder einzelnen Zelle des Lebewesens befindet. Es existieren somit viele redundante Kopien. Ist die DNA in einer Zelle beschädigt so wird sie soweit möglich repariert. Schlägt der Reparaturvorgang fehl stirbt die Zelle im Normalfall ab und wird durch eine neue Zelle ersetzt. In der neuen Zelle befindet sich eine perfekte Kopie der DNA des Lebewesens. Auf diese Weise bleiben die Daten in der DNA über die gesamte Lebensdauer des Organismus erhalten. Durch Fortpflanzung und das Klonen sind die Daten nicht auf einen Organismus beschränkt, sondern können an andere weitergegeben werden. Es ist somit sinnvoll, die DNA zur Datenspeicherung in lebenden, sich selbst regenerierenden Organismen unterzubringen. Zellen und Bakterien geben ihre DNA durch Teilung in der Regel unverändert an die neuen Zellen weiter und sind daher ideale Kandidaten zur Speicherung wie das Kapitel Langzeitspeicherung von Daten in Bakterien zeigen wird.

7.3.1 Zellen

Zellen sind von einer Membran umgeben und gehören zur Gruppe der Eukaryoten (Organismen mit Zellkern). Je nach Herkunft (pflanzlich oder tierisch) besitzen Zellen unterschiedliche Eigenschaften wie eine Zellwand oder bestimmte Organellentypen.[12] Weiterhin macht das Zellplasma circa 75 - 95% der Zellmasse aus. Zellen bewahren ihre DNA im Zellkern auf, der eine runde bis ovale Form aufweist. Sie vermehren sich durch Zellteilung, indem ihre DNA identisch verdoppelt und in die neue Zelle weitergegeben wird. Alle aus einer Zelle hervorgegangenen Tochterzellen sind daher Klone. Unter geeigneten Bedingungen kann der Prozess innerhalb von 20 Minuten abgeschlossen sein, was zu sehr kurzen Generationszeiten führt. Beim Vorgang der Zellteilung kommt es selten zu Mutationen im Erbgut, was dann zu Unterschieden in den Fähigkeiten der betreffenden Zellen führt. Diese mutierten Zellen werden in Mangelmutanten und Resistenzmutanten unterteilt. Erstere können bestimmte Substanzen nicht mehr aufbauen, letztere haben Resistenzen gegen bestimmte Substanzen (z. B. Antibiotika) entwickelt. Ob eine Mutation vorliegt, ist am Phänotyp ersichtlich. Dieser wird nicht anhand des Erscheinungsbildes der Zelle, sondern anhand der tatsächlich ausgeprägten Gene fest gemacht.[13] Dadurch wird feststellbar, ob eine Zelle ein korrekter Klon ihrer Mutterzelle ist.

7.3.2 Bakterien

Bakterien gehören zur Gruppe der Prokaryoten (zelluläre Lebewesen ohne Zellkern) und sind 1 - 2 µm lang sowie 0,5 µm dick. Sie sind von außen nach innen von einer Schleimhülle, oft einer Zellwand und einer Zellmembran umgeben. In ihnen befindet sich das Zellplasma, in dem sich unter anderem die DNA befindet. Diese schwimmt in Form eines Ringes frei umher. In der Regel werden alle nicht zu einem Kreis geschlossenen DNA-Stränge im Bakterium abgebaut.
Bakterien vermehren sich wie Zellen durch Teilung. Auch bei Bakterien kann es in seltenen Fällen zu Mutationen im Erbgut kommen, was zu Unterschieden in ihren Fähigkeiten führen kann. Diese werden wie Zellen in Mangelmutanten und Resistenzmutanten unterteilt.[14]

7.3.3 Viren

Abb.: 4 Virus (Phage)
Abb.: 4 Virus (Phage)
Viren sind durchschnittlich circa 500 nm groß und bestehen aus einer Proteinhülle, die ein oder mehrere Nukleinsäureelemente enthält. Sie besitzen keinen eigenen Stoffwechsel und werden daher nicht als Lebewesen angesehen. Zur Vermehrung benötigen sie zelluläre Lebewesen. Dazu heftet sich ein Phage (ein Virus, das Bakterien befällt, siehe animierte Abbildung 4) entweder von außen an das Bakterium und injiziert seine DNA oder dringt als Ganzes in dieses ein und entpackt die Erbinformationen erst dort. Durch die Virus DNA wird das Bakterium beeinträchtigt und produziert Phagenenzyme. Zudem werden Proteine und DNA des Bakteriums abgebaut. Im Anschluss werden die Nukleinsäure des Phagen sowie Phagenproteine durch Synthese solange im Bakterium hergestellt, bis die dazu notwendigen Bestandteile in ihm aufgebraucht sind (ca. 50 bis 200 mal). Die entstandenen Substanzen setzen sich durch eine geeignete Ladungsverteilung und auf Grund ihrer Form selbstständig zu Phagenhüllen, -schäften und -schwänzen zusammen. Anschließend wird die Zellwand durch das Enzym Lysozym aufgelöst. Durch die Art der Vermehrung werden Phagen produziert, die weitere zelluläre Lebewesen befallen können. Die Replikation von Virus-DNA verläuft somit schneller als die von Bakterien-DNA.[14] Bestimmte Viren eignen sich auf Grund ihrer natürlichen Fähigkeiten besonders zum Einschleusen von DNA in eine Zelle, so dass dieser Vorgang im Falle einer Nutzung zur Datenspeicherung nicht maschinell oder per Hand durchgeführt werden muss.

7.4 Einbringen und Auslesen von Informationen

Die Natur hat zur Manipulation von DNA durch zelluläre Lebewesen verschiedene Verfahren vorgesehen. Bakterien können freie DNA aus ihrer Umgebung aufnehmen und in ihr eigenes Chromosom einbauen (Transformation). Des Weiteren können Sie mittels einer Plasmabrücke direkt DNA von einer Bakterienzelle in eine andere einschleusen (Konjugation). Viren schleusen ihre DNA direkt in zelluläre Lebewesen ein und fügen mittels eigener Enzyme und Proteine ihre DNA in das Erbgut des Opfers ein (Transduktion).[15]
Polymere allgemein eignen sich auf Grund ihrer räumlichen Anordnung und der Wahl der Monomere zur chemischen Kodierung von Informationen. Die Nutzung von DNA als Datenspeicher ist zurzeit im Vergleich zu anderen Trägermedien wie RNA am besten untersucht.[16] DNA lässt sich durch biochemische Reaktionen und bestimmte physikalische Abläufe modifizieren. Aus den naturwissenschaftlichen Gesetzmäßigkeiten der Gesamtheit molekularbiologischer Prozesse lässt sich ableiten, dass beliebige Rechenoperationen durchführbar sind. Jeder geeignete molekularbiologische Prozess auf DNA kann als Rechenschritt betrachtet und somit als Operation im Sinne der Mathematik und Informatik verstanden werden.[17]
Die zu speichernden Daten werden in der DNA des Wirtes in Bereichen untergebracht, die für den Wirt nicht lebensnotwendig sind und ihn bestenfalls nicht beeinflussen. Sie werden mithilfe der Basen A, C, G und T (siehe Aufbau) kodiert. Als besonders widerstandsfähig gegenüber Umwelteinflüssen hat sich das Bakterium Deinococcus radiodurans erwiesen, dass die DNA in vierfacher Ausprägung vorhält. Zudem ist die DNA durch eine Ringstruktur geschützt, die sie im Falle von Beschädigungen zusammenhält. Reparaturenzyme können die Schäden dann mit Hilfe der drei vorhandenen Kopien der DNA reparieren. Tests haben gezeigt, dass in diese Bakterien-DNA eingebrachte Daten nach 100 Bakteriengenerationen noch vollständig erhalten waren.[18]

7.5 Speicherkapazität, Übertragungs- und Zugriffsgeschwindigkeit

Abb.: 5 Modell eines Chips der Daten in DNA Ketten speichert
Abb.: 5 Modell eines Chips der Daten in DNA Ketten speichert
Heutige Festplatten speichern rund 400 Gigabits pro Quadratzoll, was circa 60 Gigabits pro Quadratzentimeter entspricht.[19] Durch eine Erhöhung der Speicherdichte auf ein Niveau wie sie bei DNA gegeben ist, lassen sich pro Kubikzentimeter 1016 Bits speichern, was rund einem Petabyte entspricht. Noch kleinere Molekülstrukturen sollen Speichervolumina von bis zu 1021 Bits pro Kubikzentimeter erreichen.[20]
Makromolekulare Ketten, wie DNA, können Datenblöcke repräsentieren und mehrere Megabyte lang sein. Sie werden zur Verarbeitung beispielsweise auf Siliziumchips (siehe Abbildung 5) in speziellen Bereichen, sogenannten parking slots, abgelegt. Da DNA-Ketten elektrisch negativ geladen sind, können sie mittels elektro-magnetischer Felder auf dem Chip bewegt werden. Zum Auslesen oder Ändern der in ihnen enthaltenen Daten werden sie in entsprechende Dekodier-/Enkodiersektionen (Read/Write Station) auf dem Chip transferiert. Anschließend werden sie wieder in ihren parking slots abgelegt, bis sie erneut bearbeitet oder gelöscht (zerstört) werden.
Diese Architektur stellt Datenraten von einigen Megabits pro Sekunde an Verarbeitungsgeschwindigkeit bereit. Um mit heutigen Festplatten mithalten zu können, wird eine massiv parallele Nutzung der Chips angestrebt.[20]

8 Proteine

Proteine nehmen verschiedenste elementare Aufgaben in Lebewesen wahr, ohne die Leben nicht möglich wäre. Mit einem Anteil von circa 20% machen Proteine einen Hauptbestandteil der Zellen aus. Man unterscheidet wasserlösliche und nicht wasserlösliche Proteine. Erstere Gruppe liegt in gelöster Form in den Zellen vor. Die nicht wasserlöslichen Proteine sind die festen Bestandteile von Lebewesen. Dazu gehören unter anderem Haut, Knochen und Muskeln die zu einem Großteil aus Proteinen bestehen.
Als Synonym für den Begriff Protein wird oft der Ausdruck Eiweiß verwendet. Dabei wird das gleiche Wort auch für das Eiklar des Hühnereis gebraucht, wobei es sich aber nicht um das Gleiche handelt. Eiklar sowie Eigelb bestehen zu 11% bzw. 16% aus teils vielen verschiedenen Arten von Proteinen.[21]

Die nachfolgende Tabelle gibt einen Überblick über die verschiedenen Proteingruppen und deren Hauptaufgaben:


Tabelle 1: Proteingruppen und deren Aufgaben
Bezeichnung Aufgabe(n)
Strukturproteine Strukturproteine erfüllen vor allem mechanische Aufgaben. Sie sind Bestandteile von Muskeln, Haaren und Bindegeweben.
Transportproteine Transportproteine sorgen für den Transport bestimmter Stoffe in und aus Zellen sowie an bestimmte Stellen innerhalb der Zelle. Als Beispiel kann das im Blut befindliche Hämoglobin dienen, welches Sauerstoff in die Zellen transportiert.
Rezeptoren Rezeptorproteine sind meist außen an Zellen angelagert und stellen den Kontakt zur Umgebung her. Sie steuern, welche Substanzen von der Zelle aufgenommen oder nicht aufgenommen werden.
Regulatorproteine Regulatorproteine steuern die Produktion von Proteinen innerhalb der Zelle. Sie bestimmen, welche und in welchem Umfang Proteine durch die Zelle hergestellt werden.
Enzyme Enzyme dienen als Katalysatoren. Sie ermöglichen bzw. steuern chemische Reaktionen. Dazu gehört unter anderem die RNA-Polymerase.


Ein Protein ist nicht auf eine Aufgabe beschränkt. Es gibt Proteine, die verschiedene Aufgaben wie Transport oder auch Steuerung zugleich wahrnehmen können.[21] Für Speichertechnologien werden derzeit hauptsächlich Proteine eingesetzt, die den Gruppen Enzyme oder Transportproteine zugeordnet werden können.

8.1 Aufbau

Aminosäuren sind die elementaren Bausteine der Proteine. Sie sind vergleichbar mit Legosteinen, die auf viele verschiedene Arten kombiniert werden können. Es werden 20 verschiedene, sogenannte proteinogene Aminosäuren unterschieden, aus denen Proteine aufgebaut sind. Darüber hinaus sind noch weitere Aminosäuren bekannt, die sich jedoch nicht in Proteinen finden. Aufgrund ihrer atomaren Struktur sind Aminosäuren in der Lage Ketten zu bilden. Diese Ketten sind nicht zwingend linear, sondern können auch Abzweigungen bilden, sodass ein dreidimensionales Gebilde entsteht. Verkettungen ab einer Anzahl von 100 Aminosäuren werden als Protein bezeichnet. Das größte bekannte menschliche Protein, das Titin, besteht aus über 30.000 verketteten Aminosäuren.[22]
Die verschiedenen Eigenschaften der Proteine werden einerseits durch die Art der "verbauten" Aminosäuren und andererseits durch die strukturelle, dreidimensionale Anordnung von Aminosäuren im Proteinmolekül bestimmt. Viele Proteine beinhalten noch weitere, funktionsgebende Stoffe. Ein Beispiel dafür ist das Hämoglobin. Es enthält Eisenatome, die den Sauerstofftransport erst ermöglichen.
Diese teilweise hochkomplexen Moleküle stellt eine Zelle bei Bedarf selbst her. Näheres dazu ist im Abschnitt Funktion beschrieben.
Wie im Kapitel Aufbau der DNA beschrieben, weißt die DNA vier verschiedene Grundbausteine (Adenin, Cytosin, Guanin, Thymin) auf. Eine Dreiergruppe dieser Grundbausteine kodiert eine Aminosäure. An dieser Stelle kann bereits eine Parallele zu bestehenden Speichersystemen gezogen werden. Informationen werden in der Informatik durch das Binärsystem kodiert. Eine Speicherstelle kann in diesem Fall zwei Ausprägungen haben. Eine bestimmte Menge dieser Speicherstellen wird üblicherweise zu einer Gruppe zusammengefasst und kodiert einzelne Zeichen. Fasst man Gruppen dieser Zeichen zusammen, so erhält man üblicherweise Programmcode oder Daten wie beispielsweise Text. Ähnlich verhält es sich mit der DNA. Eine Speicherstelle kann von einer der vier Grundbausteinen der DNA besetzt sein. Eine Dreiergruppe von Speicherstellen kann so 43 = 64 verschiedene Zustände, in der Analogie Zeichen, darstellen. 20 dieser Zustände repräsentieren die proteinogenen Aminosäuren aus denen die Proteine aufgebaut sind. Viele dieser Dreiergruppen zusammengenommen ergeben den Bauplan für das Protein, der Gen genannt wird.

8.2 Funktionsweise

Viele Vorgänge in Organismen funktionieren nach dem Schlüssel-Schloss-Prinzip. Die dreidimensionale Struktur der Proteine ergibt ein spezielles Muster (den "Schlüssel") mit dessen Hilfe ein Protein an einem Gegenstück "andocken" kann. Dies kann bei einem Markerprotein ein bestimmter DNA-Abschnitt sein. Bei einem Protein des Immunsystems kann die Oberfläche des Proteins genau auf die Oberfläche eines Krankheitserregers passen. Auf diese Weise erkennt der Organismus Eindringlinge und kann diese bekämpfen. In Abbildung 6 ist ein Enzym dargestellt. Es katalysiert, also unterstützt, die Reaktion der beiden Substrate zum fertigen Produkt nach dem Schlüssel-Schloss-Prinzip.
Abb. 6: Schlüssel-Schloss-Prinzip
Abb. 6: Schlüssel-Schloss-Prinzip
Wie schon im Abschnitt Aufbau erläutert, beinhalten viele Proteine auch Bestandteile, die nicht aus Aminosäuren bestehen. Das Hämoglobin erfüllt seine Aufgabe Sauerstoff zu transportieren mittels in das Protein eingeschlossener Eisenatome. An diese Eisenatome bindet sich der Sauerstoff und kann dann transportiert werden. Die Bindung des Sauerstoffs an das Protein ist jedoch reversibel. Diese besondere Eigenschaft ist charakteristisch für Proteine. Sie können ihre Aufgabe erfüllen, ohne dabei verbraucht zu werden.

8.3 Speichern und Auslesen von Daten

Die zentrale Fragestellung dieses Abschnittes ist, wie sich die Eigenschaften von Proteinen zum Speichern und Auslesen von Daten nutzen lassen. In der Wissenschaft wird dabei den optischen Verfahren die meiste Beachtung geschenkt. Man konzentriert sich hier auf Proteine, deren wesentliche Funktion auch in der Natur auf ihren photochromen (sich unter Bestrahlung verändernden) Eigenschaften beruht. Das bekannteste Protein mit photochromen Eigenschaften in der Pflanzenwelt ist das Chlorophyll. Dieses ist eng verwandt mit dem Hämoglobin. Anstatt eines Eisenatoms befindet sich hier jedoch ein Magnesiumatom als eigenschaftsgebendes Teilchen im Protein. Das Chlorophyll dient der Pflanze beim Prozess der Photosynthese als Energielieferant. Durch das Chlorophyll wird elektromagnetische Energie (Lichtenergie) in chemische Energie umgewandelt. Diese Energie nutzt die Pflanze für den Stoffwechsel. Die Nutzung von Licht als Energiequelle wird Phototrophie genannt.
Abb. 7: Struktur von Bakteriorhodopsin
Abb. 7: Struktur von Bakteriorhodopsin
Die Energieumwandlung erfolgt bei der Phototrophie, indem das Protein durch seine chemischen Eigenschaften Lichtenergie eines bestimmen Spektrums absorbiert. Die aufgenommene Energie versetzt das Protein in einen angeregten Zustand in dem es andere Eigenschaften annimmt und die Energie für verschiedene Zwecke wieder abgeben kann. Danach fällt es in seinen Ausgangszustand zurück und kann erneut durch Lichteinwirkung angeregt werden. Der Vorgang verläuft also reversibel.
Neben dem Chlorophyll gibt es ein weiteres phototrophes Protein, das die oben genannten Eigenschaften besitzt. Dem sogenannten Bakteriorhodopsin (nachfolgend kurz BR) wird in der Fachliteratur eine große Bedeutung zugemessen. BR ist in der Zellmembran von Halobacterium salinarum vorhanden. Dieses Bakterium existiert in gesättigten Salzlösungen von Salzseen. Es ist der Wissenschaft seit etwa 30 Jahren bekannt und sehr gut erforscht. Unter dem Einfluss von Lichtenergie durchläuft BR einen sogenannten Photozyklus. Während dieses Zyklus nimmt BR spektroskopisch unterscheidbare Zustände an. Das bedeutet, dass je nach Zustand andere Wellenlängen des sichtbaren Lichtes absorbiert werden. Das Protein ändert somit seine Molekülstruktur und Farbe unter dem Einfluss von Sonnenlicht. Diesen Umstand möchte man sich technisch nutzbar machen.[23]
Der nicht angeregte Zustand des Proteins kann als binäre Null und jeder angeregte Zustand als binäre Eins definiert werden. Durch systematische Fixierung vieler dieser Proteine auf einem Trägermedium lässt ein Datenträger herstellen. Das Beschreiben dieses Datenträgers erfolgt durch Anregen der Proteine mit Licht einer bestimmten Wellenlänge. Das Auslesen geschieht, indem die Farbänderung der Proteine erfasst wird. Das Löschen wird realisiert, indem die Proteine aus einem angeregten Zustand wieder in ihren Ausgangszustand überführt werden. Dies kann zum Beispiel durch Bestrahlung mit einer anderen Wellenlänge oder thermischen Veränderungen erreicht werden. Auf Basis von Bakteriorhodopsin gibt es bereits verschiedene Prototypen beziehungsweise Anwendungsbeispiele. Diese werden im Kapitel Praktische Anwendung vorgestellt.
Durch die Nutzung von laserbasierten, optischen Verfahren zum Speichern und Auslesen von Daten ist es möglich, auf bereits erprobte Technologien zurückzugreifen. Die Größe von Proteinen ist in etwa mit der Größe von "Lands" und "Pits" auf DVD- bzw. Blue-Ray Medien vergleichbar. Somit ist die Fokussierung auf solche kleinen Punkte technisch durchführbar. Auch das Schreiben und Lesen in mehreren Schichten ist bereits bei DVD und Blue-Ray realisiert und kann für die Nutzung in Verbindung mit proteinbasierten Datenspeichern angepasst werden.[24]

8.4 Speicherkapazität, Übertragungs- und Zugriffsgeschwindigkeit

Abb. 8: Fokussierung des Lasers auf eine Ebene am Beispiel der DVD
Abb. 8: Fokussierung des Lasers auf eine Ebene am Beispiel der DVD
Die mit einer Speichertechnologie erreichbare Speicherkapazität hängt maßgeblich von der Speicherdichte ab. Je mehr Daten pro Fläche oder Rauminhalt abgelegt werden können, desto höher ist konsequenterweise die Speicherkapazität. Mit zunehmender Speicherdichte erhöht sich in der Regel auch die Übertragungsrate, da bei gleicher Abtastgeschwindigkeit mehr Daten gelesen oder geschrieben werden können.
Weitere Steigerungen der Speicherkapazität können dadurch erreicht werden, dass die Daten nicht in einer Ebene gespeichert werden, sondern in mehreren Ebenen bis hin zu kubusförmigen Strukturen. Das heißt, dass nicht eine Schicht aus Proteinen zur Datenspeicherung verwendet wird, sondern die Proteine dreidimensional in einer Fixiermasse angeordnet werden. Der Zugriff erfolgt durch Laser ähnlich wie bei mehrlagigen DVDs. Je nachdem welche Schicht gelesen oder geschrieben werden soll, wird der Laser entsprechend fokussiert. Auf diese Weise sollen Speicherdichten möglich werden, die bis zu zwanzigmal größer als bei Blue-Ray Medien sind (siehe auch Kapitel Proteinbasierte DVD).[25]
Die Zugriffsgeschwindigkeit, also die Zeit die nötig ist bis an einer bestimmten Stelle geschrieben oder gelesen werden kann, hängt maßgeblich von der technischen Umsetzung des Datenspeichers ab. Im Kapitel Proteinbasierte DVD wird ein Datenspeicher vorgestellt, der dem Aufbau von DVD-Medien ähnelt. Es ist zu erwarten, dass die Zugriffsgeschwindigkeit mit der Zugriffsgeschwindigkeit aktueller optischer Speichertechnologien vergleichbar sein wird.

9 Praktische Anwendung

In diesem Kapitel sollen auf Basis der bisher vorgestellten Ansätze praktische Anwendungen aufgezeigt werden. Da die Ansätze ausnahmslos Gegenstand aktueller Forschung sind, gibt es bisher (2009) keine Produkte auf dem Markt, in denen diese Technologien eingesetzt werden. Wie weit eine Markteinführung entfernt ist, soll nach Möglichkeit in den jeweiligen Unterabschnitten geklärt werden.
Gerade bei magnetischen Datenträgern werden in Zukunft physikalische Grenzen erreicht, die eine Erhöhung der Speicherdichte nicht mehr oder nur unter sehr hohem Aufwand zulassen. Aus diesem Grund wird nach Alternativen zu bisher gebräuchlichen Speichertechnologien gesucht. In wie weit sich diese auch im Alltag einsetzen lassen werden, müssen die noch zu entwickelnden Produkte zeigen.

9.1 Lösung des Rucksackproblems durch DNA

Ein klassisches Optimierungsproblem aus dem Bereich der Kombinatorik ist das Rucksackproblem. Zur besseren Verständlichkeit soll das folgende Szenario dienen:
Eine Raumfahrtorganisation plant in der nächsten Zeit eine Rakete ins All zu schießen. Die Rakete ist bereits von der Raumfahrtorganisation beladen worden und bietet noch eine freie Kapazität von 645 kg. Zur Nutzung der freien Kapazität veröffentlicht die Raumfahrtorganisation ein Angebot, Geräte zu Forschungszwecken von Institutionen mitzunehmen. Sie bekommt daraufhin 60 Angebote von Forschungsinstitutionen mit dem Gewicht des zu transportierenden Geräts und den Ausgaben, die die Institutionen bereit sind dafür zu zahlen. Für die Raumfahrtorganisation stellt sich nun die Frage, welche Geräte sie mitnehmen soll, um möglichst hohe Einnahmen zu erwirtschaften.
Die Rakete des Szenarios ist ein Symbol für den Rucksack, der maximal ein bestimmtes Gewicht T trägt, das als Gewichtsschranke bezeichnet wird. Weiter existieren eine Reihe von Gegenständen (Objekte) der Menge n, die jeweils ein bestimmtes Gewicht und einen bestimmten Wert an Einnahmen (Profit) besitzen. Gesucht ist nun die Teilmenge an Gegenständen, die die Gewichtsschranke nicht verletzten und den höchsten Gesamtprofit versprechen.

Zusammengefasst und vereinfacht könnte das Beispiel wie folgt aussehen: Die Gewichtsschranke betrage T = 645. Die Menge an Geräten (Objekten) betrage 8 (n = 8) mit folgenden Eigenschaften:

Tabelle 2: Zur Auswahl stehende Objekte und deren Eigenschaften[26]
Objekt-Nr. 1 2 3 4 5 6 7 8
Gewicht in kg 153 54 191 66 239 137 148 249
Profit in 1000 Euro 232 73 201 50 141 79 48 38
Profitdichte (Profit / Gewicht) 1.52 1.35 1.05 0.76 0.59 0.58 0.32 0.15


Um den Profit zu maximieren erscheint es sinnvoll, zuerst die Objekte mit der höchsten Profitdichte auszuwählen, wie sie die Tabelle 2 absteigend sortiert darstellt. Demnach würde ein Algorithmus mit dem Objekt der höchsten Profitdichte beginnen und es in den Rucksack legen. Danach würde es das zweite hinzufügen und erst stoppen, wenn das Gewicht der vorhandenen Objekte addiert zu dem des nächsten die Gewichtsschranke überschreitet. Die Objekte 1, 2, 3 und 4 besitzen zusammen ein Gewicht von 464 kg. Das Objekt 5 wiegt 239 kg und würde mit den schon vorhandenen Objekten von 464 kg die Gewichtsschranke von 645 kg um 58 kg überschreiten. Die vorhandenen Objekte erzielen einen Profit von 556. Dieser Profit ist jedoch nicht maximal, da zusätzlich Objekt 6 hinzugefügt werden kann und so der Profit auf 647 gesteigert wird. Auch dieser Profit ist nicht maximal. Um den maximalen Profit zu finden, müssen demnach alle Kombinationen ausprobiert werden. Da jedes der Objekte im Rucksack oder nicht im Rucksack sein kann, gibt es pro Objekt 2 Möglichkeiten. Dies führt bei n Objekten zu 2n Kombinationsmöglichkeiten. Die optimale Kombination ergibt sich daher aus der Teilmenge, die den größten Profit erwirtschaftet. Sie besteht aus den Objekten 1, 2, 3 und 5 mit einem Gesamtgewicht von 637 kg und einem Profit von 647. Dies ist die optimale Lösung.
Die optimale Lösung ist demnach nur durch Ausprobieren zu finden. Allerdings steigt die Anzahl an Kombinationsmöglichkeiten mit Zunahme der Objekte exponentiell an, so dass sich für das Beispiel der Raumfahrtorganisation mit 60 Objekten

260 = 1.152.921.504.606.846.976

(mehr als eine Trillion) Kombinationsmöglichkeiten ergeben. Unter der Annahme ein Computer schaffe es pro Sekunde eine Milliarden Teilmengen zu prüfen, so benötigt er trotzdem noch rund 36 Jahre um alle Möglichkeiten zu ermitteln und die profitabelste zu finden.[27]

Die mathematische Definition des Rucksackproblems für natürlichen Zahlen lautet wie folgt:
Gegeben seien n natürliche Zahlen a1, a2, ..., an mit n \in \mathbb{N} \setminus \lbrace 0 \rbrace, sowie eine natürliche Zahl b. Gibt es eine Teilmenge \mathbb{I} \subseteq \lbrace 1,\ 2,\ ..., n \rbrace für die \sum_{i\in I}a_i = b gilt?[28]

n steht in der Formel für die Summe aller zur Verfügung stehenden Objekte, die in den Rucksack gelegt werden können. ai bezeichnet das Gewicht eines einzelnen Objektes. b steht für das maximale Füllgewicht des Rucksacks, also die Gewichtsschranke, die im vorherigen Beispiel mit T bezeichnet wurde. Gesucht ist demnach die Kombination von Objekten, deren Gewicht zusammen genau das Füllgewicht des Rucksacks ergeben.
Abb. 9: Sukzessive DNA Verkettung zur Lösung des Rucksackproblems
Abb. 9: Sukzessive DNA Verkettung zur Lösung des Rucksackproblems
Die Lösung des Rucksackproblems mit Hilfe von DNA verfolgt auch einen Brute-Force-Ansatz. Ausgehend von einem DNA Strang der als Start dient werden sukzessiv alle Packmöglichkeiten durch Anhängen von DNA Strängen mittels Ligation durchprobiert. Die angehängten DNA Stränge entsprechen dabei in ihrer Länge dem jeweiligen Gewicht des darzustellenden Objektes. Während jedes Durchlaufes werden die vorhandenen DNA Stränge gedoppelt, wobei nur eine Hälfte mit dem jeweils neuen DNA Strang ai verkettet wird.

Dadurch werden im Verlauf Stränge unterschiedlicher Länge erzeugt, die jeweils eine Packmöglichkeit des Rucksacks mit verschiedenen Objekten repräsentieren. Nach der Erzeugung existieren mindestens 2n DNA Stränge in einem DNA Pool, die sich in ihrer Struktur unterscheiden. Aus diesem Pool werden alle unerwünschten Produkte (Ketten ohne Starter, Monomere aus ai DNA) beseitigt. Der übrige Inhalt des Pools wird dann durch Gel-Elektrophorese auf DNA Ketten hin untersucht, deren Länge zum Referenzgewicht b korrespondieren. Existiert mindestens eine solche Kette, lautet die Antwort auf die Problemlösung "ja", sonst "nein".

Das Rucksackproblem ist mittels DNA in linearer Zeit lösbar. Der exponentielle Anstieg der benötigten Zeit mittels konventioneller Computertechnik wird in dem DNA Verfahren auf die Menge an benötigtem Speicher umgelegt.[29][30]

9.2 Langzeitspeicherung von Daten in Bakterien

Die Speicherung von Daten in Bakterien wurde durch japanische Forscher im Jahr 2007 erstmals erfolgreich durchgeführt. In Versuchen kodierten sie die Formel "E = mc2" in die DNA von Bakterien. Um die Daten gegen Mutationen im Erbgut zu schützen, legten sie diese an vier verschiedenen Stellen im Erbgut ab. Die Daten waren solange erhalten, wie die Bakterien lebten und wurden durch die Zellteilung kontinuierlich an die Nachfahren weitergegeben. Die Forscher gehen davon aus, dass Daten auf diese Weise mehrere Millionen Jahre gespeichert werden können.[31] Theoretisch können Bakterien in einer lebensfreundlichen Umwelt ewig leben. Da sich durch die Zellteilung und die damit verbundene Replikation der DNA allerdings Fehler einschleichen können, kann die Zellteilung je nach Mutation "irgendwann" aussetzen und das Bakterium sterben.

9.3 Datenspeicherung in einzelnen Eisenatomen auf einem metallorganischen Netz

Abb. 10: Eisenatome in organischem Gitter (Eisenatome grün, organisches Gitter schwarz)
Abb. 10: Eisenatome in organischem Gitter (Eisenatome grün, organisches Gitter schwarz)
Die Erhöhung der Speicherdichte bei magnetischen Datenspeichern erfolgt in der Regel durch Miniaturisierung der Bauteile. Dabei wird insbesondere versucht, die zur Speicherung einzelner Bits notwendige Fläche zu reduzieren.

Wissenschaftlern ist es gelungen, die Speicherdichte so weit zu erhöhen, dass Bits in einzelnen Eisenatomen gespeichert werden können. Die Eisenatome sind in einem Gitter aus organischen Molekülen auf einer Kupferoberfläche angeordnet (siehe Abbildung 10) und haben einen Abstand von rund 1,5 Nanometern zueinander. Das organische Gitter aus Terephthalsäuremolekülen bildet sich in einer Art Selbstorganisation, ähnlich der kristallinen Gitterstruktur von Kochsalz, automatisch heraus.

Die Aufbringung der Struktur auf die Kupferoberfläche erfolgt nach einem Verfahren, bei dem Eisenatome sowie die Terephthalsäure in einer Vakuumkammer aufgedampft werden. Befinden sich die beiden Stoffe im richtigen Mischungsverhältnis zueinander, so ordnen sich jeweils vier Säuremoleküle um ein Eisenatom an. Der große Vorteil der Selbstorganisation liegt darin, dass auf diese Weise sehr viel kleinere Strukturen als mit bisherigen Fertigungsverfahren erreicht werden können. Weiterhin wird die Fertigung stark vereinfacht.

Die Datenspeicherung erfolgt über das magnetische Moment der Eisenatome. Das magnetische Moment ist vergleichbar mit einem Stabmagnet. Zur Verbesserung der Anschaulichkeit wird nachfolgend der Begriff des Stabmagneten anstatt der des magnetischen Moments verwendet. Die Ausrichtung des Stabmagneten liegt aufgrund der chemischen Struktur des Gebildes waagerecht in der Ebene. Die Kodierung von binären Informationen erfolgt über die Änderung der Ausrichtung der Stabmagnete. Auf diese Weise lassen sich Einsen und Nullen darstellen. Dazu wird einem Eisenatom selektiv ein Sauerstoffatom hinzugefügt. Durch die Anbindung des Sauerstoffatoms klappt der Stabmagnet aus der Ebene heraus.

Die bisher einzige Methode den Datenspeicher zu beschreiben liegt darin, durch ein Rastersondenmikroskop einzelne Sauerstoffatome aufzunehmen und auf die entsprechenden Eisenatome aufzubringen. Dieser äußerst langwierige Prozess eignet sich noch nicht dazu, größere Mengen an Daten zu speichern.

Abb. 11: Polarisationsrichtungen (rot / blau linear polarisiert, schwarz zirkulär polarisiert)
Abb. 11: Polarisationsrichtungen (rot / blau linear polarisiert, schwarz zirkulär polarisiert)

Das Auslesen des Speichers kann über eine einfachere Methode erfolgen. Das Material wird mit so genannter polarisierter Röntgenstrahlung bestrahlt. Polarisiert bedeutet, dass die Wellen der Röntgenstrahlung alle in genau einer Richtung schwingen. Das Verfahren der Polarisierung wird auch beim Satellitenfernsehen genutzt. Hier werden zur besseren Ausnutzung des Übertragungsbandes die Signale entweder horizontal oder vertikal, also linear polarisiert. Die dritte Möglichkeit der Polarisation besteht darin, dass sich die Welle um ihre Ausbreitungsachse dreht, was als zirkuläre Polarisation bezeichnet wird. Sie kann sowohl links- als auch rechtsdrehend polarisiert sein (vergleiche Abbildung 11). Diese Art der Polarisation wird zum Auslesen des Datenspeichers genutzt. Treffen die zirkulär polarisierten Röntgenstrahlen auf die Eisenatome so werden sie, abhängig von der Ausrichtung des Stabmagneten und der Polarisationsrichtung unterschiedlich stark absorbiert. Die Differenz in der Absorption der beiden Polarisationsrichtungen (links- oder rechtsdrehend) lässt sich messen und so auf die Ausrichtung des Stabmagneten schließen.

Neben den komplexen Schreib- und Lesevorgängen besteht das Problem, dass das Speichermaterial auf rund minus 270 °C heruntergekühlt werden muss. Andernfalls ist die Wärmeenergie groß genug, um die Stabmagnete aus ihrer Lage zu bringen. Diese beiden Fakten sprechen gegen die Entwicklung konkreter Produkte in nächster Zeit. Jedoch kann auf Basis der Erkenntnisse weitere Forschung betrieben werden, die dann zu konkreten Produktentwicklungen führen kann.[19]

9.4 Proteinbasierte DVD

Im Kapitel Proteine wurde bereits das Protein Bakteriorhodopsin (kurz BR) als möglicher Datenspeicher für digitale Daten vorgestellt. In diesem Kapitel wird die konkrete Umsetzung eines Prototyps auf Basis von BR betrachtet. Dieser wurde bereits im Sommer 2006 in Australien vorgestellt und entstand in einer Kooperation eines Forscherteams um Professor Venkatesan Renugopalakrishnan und dem Elektronikkonzern NEC. Das Produkt wurde mehrmals umbenannt und soll protein coated disc (PDC) heißen.

Ursprünglich war eine Markteinführung 18 bis 24 Monate nach Vorstellung des Prototyps geplant. Jedoch sind bis heute keine weiteren Informationen zum Fortschritt des Projektes an die Öffentlichkeit gedrungen. Es ist nicht klar wodurch die Verzögerung verursacht wird, es ist jedoch denkbar, dass einige technische Probleme nicht rechtzeitig gelöst werden konnten.

Abb. 12: Datenschicht; Einbettung von BR in eine Membran
Abb. 12: Datenschicht; Einbettung von BR in eine Membran
In der Natur hält der angeregte Zustand von BR zwischen wenigen Millisekunden bis in den Bereich von Stunden oder Tagen an, je nachdem welche Zwischenzustände während des Photozyklus erreicht werden.[24][32] Für einen permanenten Datenträger ist dieser Zeitraum viel zu kurz. Dieses Problem will das Forscherteam bereits 2006 erfolgreich gelöst haben. Dazu wurde die BR kodierende Stelle der DNA mit Hilfe von Gentechnik geändert. Dadurch produziert das Bakterium eine modifizierte Variante von BR, deren angeregter Zustand über mehrere Jahre stabil erhalten bleiben soll. Weitere Modifikationen sollen die Stabilität des Proteins auch bei höheren Temperaturen verbessert haben.
Die Umsetzung des Datenträgers orientiert sich an bekannten Formen und Größen. So wird auf die Bauform der CD und DVD zurückgegriffen. Das Protein BR wird in der Datenschicht wie in der Natur in eine Membran eingebettet und so fixiert (siehe Abbildung 12). Der genaue Aufbau des Datenträgers ist jedoch unbekannt. Das Beschreiben und Lesen soll, wie schon im Kapitel Speichern und Auslesen von Daten erläutert, optisch erfolgen. Genaue Spezifikationen für die verwendeten optischen Elemente sind nicht bekannt und nur ungenaue Angaben gibt es zur Kapazität. So ist die Rede von einer mindestens zwanzigfach höheren Speicherkapazität als bei der Blue-Ray Disc. Weiterentwicklungen sollen es ermöglichen, bis zu 50 Terabytes an Daten auf einem Medium unterzubringen. Seit den offiziellen Informationen von 2006 wurden keine weiteren Ankündigungen gemacht (Stand 2009). Daher ist davon auszugehen, dass die PCD kurzfristig nicht auf dem Markt erscheinen wird.[25][33]

9.5 Proteine als Träger von Sicherheitsinformationen

Abb. 13: Ausweis mit Bundesadler als Sicherheitsmerkmal (halbseitig belichtet)
Abb. 13: Ausweis mit Bundesadler als Sicherheitsmerkmal (halbseitig belichtet)
Abb. 14: "Datenfenster" auf Ausweis mit gespeichertem Bild
Abb. 14: "Datenfenster" auf Ausweis mit gespeichertem Bild
Auch in der Sicherheitstechnik sind verschiedene Anwendungen denkbar, die auf biologischen Prozessen beruhen. In diesem Kapitel werden marktreife Lösungen beschrieben, bei denen das Protein Bakteriorhodopsin als Träger von Sicherheitsinformationen genutzt wird. Bei diesen Anwendungen hat man sich darauf spezialisiert, das Nachahmen von Dokumenten wie Ausweisen zu erschweren, da hochwertige Fotokopien heutzutage bereits mit relativ einfachen Mitteln herzustellen sind. Selbst Banknoten lassen sich mit entsprechendem Aufwand täuschend echt fälschen. Die Erschwernis für Fälscher bei der Nutzung von BR basierten Sicherheitsmerkmalen liegt hauptsächlich in einer technologischen Hürde, da sich BR bisher nicht synthetisch herstellen lässt. Der Fälscher ist also darauf angewiesen, gentechnisch modifizierte Bakterien zu züchten, um mit ihrer Hilfe BR mit den entsprechenden physikalisch, technischen Eigenschaften gewinnen zu können. Sofern das nötige Wissen und die technischen Voraussetzungen vorhanden sind, lässt sich BR in sogenannten Bioreaktoren (Fermentern) kostengünstig gewinnen.[24]

9.5.1 Verhindern von Fotokopien

Das in der Natur vorkommende BR hat eine violette Ausgangsfarbe. Unter intensiver Bestrahlung mit grünem Licht ändert es seine Farbe nach gelb. Dieser angeregte Zustand hält beim "Wildtyp" jedoch nur für etwa 10 Millisekunden an.[24] Durch das gezielte Austauschen einer bestimmten Aminosäure im Protein konnte die Haltbarkeit des angeregten Zustandes bis hin zu einigen Minuten verlängert werden. Überdies ist es möglich, den angeregten Zustand durch Bestrahlung mit blauem Licht wieder in den violetten Ausgangszustand zu versetzen. Man erhält auf diese Weise quasi einen optischen Schalter.

Die physikalisch, chemischen Eigenschaften von BR ermöglichen es, das Protein unter anderem als Pigment in Druckfarben einzusetzen. Es kann daher mit allen bekannten Druckverfahren kostengünstig auf Dokumente aufgebracht werden. Ein weiterer Vorteil des Druckes ergibt sich daraus, dass sich Materialstärke und Form einfach modifizieren lassen.

Abbildung 13 zeigt einen Ausweis, der als Sicherheitsmerkmal einen aufgedruckten Bundesadler enthält. Die Druckfarbe beinhaltet BR Pigmente. Um den Farbunterschied durch Belichtung kenntlich zu machen, wurde die rechte Hälfte des Sicherheitsmerkmals belichtet. Versucht man das Dokument einzuscannen, verändert das Sicherheitsmerkmal durch den Lichteinfall seine Farbe. Der Grünanteil im Scannerlicht reicht aus, um die Farbänderung bereits während des Scanvorganges eintreten zu lassen.

Abb. 15: 2D Barcode
Abb. 15: 2D Barcode

Ferner kann bei einem vorliegenden Dokument durch einfache Belichtung geprüft werden, ob eine Farbänderung eintritt. Tut sie dies nicht, ist das Dokument nicht echt. Der Test dauert nur wenige Sekunden und ist ähnlich einfach durchführbar wie heutige Banknotentests.

Noch sicherer ist die Einbettung von Informationen in das Sicherheitsmerkmal. So kann zum Beispiel das Bild des Ausweisinhabers in einem "Datenfenster" aufgedruckt werden. Durch einen Bestrahlungstest wird es dann sichtbar (siehe Abbildung 14). Statt eines Bildes lassen sich auf optischem Wege auch digitale Informationen kodieren, die von Scannern gelesen werden können. Das Verfahren arbeitet analog zu dem der selbst ausdruckbaren Postwertzeichen (siehe Abbildung 15 "2D Barcode").

9.5.2 Speicherung von Sicherheitsinformationen in Datenfeldern

Abb. 16: Permanentes, optisches Beschreiben eines BR Datenfeldes
Abb. 16: Permanentes, optisches Beschreiben eines BR Datenfeldes
Durch Bestrahlung mit kurzen, intensiven Laserimpulsen lässt sich eine modifizierte Version von BR in einen dauerhaft angeregten Zustand versetzen. Dadurch kann ein Datenträger irreversibel beschrieben werden (siehe Abbildung 16). Es handelt sich um einen sogenannten WORM-Speicher (write-once-read-multiple). Im Datenfenster des Ausweises lassen sich so digitale Daten in der Größenordnung von Megabytes ablegen.[24]

9.5.3 Rückverfolgung und Echtheitsnachweis

Um einen Ausweis der beschriebenen Arten zu kopieren muss es dem Angreifer nicht nur möglich sein, eine BR Schicht mit den digitalen Informationen zu beschreiben. Er muss überdies noch den genauen Typ des eingesetzten Proteins duplizieren. Nicht jede der 248 Aminosäuren aus denen BR aufgebaut ist trägt zur Funktion bei. Somit ist es möglich einige auszutauschen, ohne die technischen Eigenschaften zu verändern. An diese Stellen kann jeweils eine beliebige andere der 20 proteinogenen Aminosäuren (siehe Kapitel Aufbau von Proteinen) gesetzt werden. Bei einer Kette von vier Aminosäuren ergeben sich so 204 = 160.000 Möglichkeiten. Ohne Probleme kann man auch eine Kette von zehn Aminosäuren zur Kodierung verwenden. In diesem Fall gäbe es 20^{10}\approx10^{12}, also rund eine Billionen Möglichkeiten. Es lassen sich also für verschiedene Chargen oder sogar jede einzelne Produkteinheit individuelle Varianten von BR mit identischen Eigenschaften herstellen. Aus der jeweiligen "Signatur" ließe sich auch darauf schließen, woher ein bestimmtes Sicherheitsmerkmal stammt. Die Erkennung der modifizierten Aminosäuregruppen ist jedoch sehr schwierig und bedarf einer aufwendigen Analyse. Jedoch ist damit eine zweifelsfreie Identifizierung möglich.[24] Die technischen Hürden zur Nachahmung liegen sehr hoch. Fälscher benötigen neben dem Wissen auch kostenintensive Anlagen um auf BR basierende Sicherheitsmerkmale zu kopieren.

10 Fazit

Im vorliegenden Dokument konnten erfolgreich Konzepte zur Datenspeicherung mittels biologischer Technologien aufgezeigt werden. Insbesondere der Bionik wird in diesem Bereich ein großes Potenzial zugesprochen. Unter ihrer Zuhilfenahme wird an Verbesserungen geforscht, um die Technologien letztendlich für den breiten Markt zugänglich zu machen. Die im Abschnitt Praktische Anwendung vorgestellten Techniken wie Proteine als Träger von Sicherheitsinformationen haben teilweise bereits marktreife erlangt und können produktiv eingesetzt werden. Andere Verfahren, besonders im Bereich der Kombinatorik wie die Lösung des Rucksacksproblems, sind bisher nur unter Laborbedingungen durchführbar und stehen dem Markt in naher Zukunft nicht zur Verfügung. Die bisher entwickelten Ansätze lösen das Problem der begrenzten Speichertechnologie vorerst, indem die Strukturen zur Speicherung verkleinert werden. Jedoch gibt es auch weiterhin ungelöste Probleme. Zu nennen sind je nach Anwendungsgebiet die Haltbarkeit der Daten, der Zugriff auf die Daten, die produktgerechte Aufbewahrung und die geringe Datenübertragungsrate. In naher Zukunft scheinen die Probleme nicht gelöst werden zu können, so dass insbesondere die Einführung großvolumiger Datenspeicher noch weit in der Zukunft liegt.

11 Fußnoten

  1. vgl. Hinze T., Sturm M. (2004), S. 1
  2. vgl. Kleesattel W. (2005), S. 7
  3. vgl. Nachtigall W. (2002), S. 3ff.
  4. vgl. Klußmann N., Malik A. (2007), S. 327f.
  5. 5,0 5,1 vgl. Frank R. et al. (1997), S. 66
  6. vgl. Hinze T., Sturm M. (2004), S. 97
  7. vgl. Hinze T., Sturm M. (2004), S. 99
  8. vgl. Hinze T., Sturm M. (2004), S. 101
  9. vgl. Zimmer D. (2005), S. 63ff.
  10. vgl. Quarks & CO (2003)
  11. vgl. Zimmer D. (2005), S. 61
  12. vgl. Sengbusch P. (2003)
  13. vgl. Phänotyp (o.J.)
  14. 14,0 14,1 vgl. Frank R. et al. (1997), S. 68
  15. vgl. Frank R. et al. (1997), S. 72
  16. vgl. Hinze T., Sturm M. (2004), S. 99
  17. vgl. Hinze T., Sturm M. (2004), S. 97
  18. vgl. Biologische Festplatte (2003)
  19. 19,0 19,1 vgl. Datenspeicher gehen ins Netz (2009)
  20. 20,0 20,1 vgl. M. Mansuripur, et al. (o.J.), S. 1
  21. 21,0 21,1 vgl. Zimmer D. (2005), S.31ff.
  22. vgl. Linke W. (2000)
  23. vgl. Neebe M. (2003), S. 8
  24. 24,0 24,1 24,2 24,3 24,4 24,5 vgl. Hammp N. (o.J.)
  25. 25,0 25,1 vgl. Salleh A. (2006)
  26. entnommen Beier R. et al. (2006), S. 1
  27. vgl. Beier R. et al. (2006), S. 1
  28. vgl. Hinze T., Sturm M. (2004), S. 95
  29. vgl. Hinze T., Sturm M. (2004), S. 122f
  30. vgl. Hinze T., Sturm M. (2004), S. 294f
  31. vgl. List A. (2007)
  32. vgl. Zimmer D. (2005), S. 9
  33. vgl. Laurer M. (2007)

12 Literaturverzeichnis

Beier R. et al. (2006) Beier R., Vöcking B: Das Rucksackproblem, Quelle: http://www-i1.informatik.rwth-aachen.de, o.V., o.O., 2006, Abrufdatum: 22.05.2009, Uhrzeit: 13:46
Borchard-Tuch C., Groß M. (2002) Borchard-Tuch C., Groß M.: Was Biotronik alles kann - blind sehen, gehörlos hören ..., Weinheim , 2002
Datenspeicher gehen ins Netz (2009) Datenspeicher gehen ins Netz, Quelle: http://www.organische-chemie.ch/, o.V., o.O., Abrufdatum: 19.05.2009, Uhrzeit: 20:46
Biologische Festplatte (2003) Biologische Festplatte, Quelle: http://zeus.zeit.de/, Die Zeit, o.O., 2003, Abrufdatum: 19.05.2009, Uhrzeit: 22:10
Frank R. et al. (1997) Frank R., Sommermann U., Ströhla G.: Natura - Genetik und Immunbiologie, o.O., 1997
Hammp N. (o.J.) Hammp N.: Bakteriorhodopsin - ein photochromes Protein für die Sicherheitstechnik und ein Modellsystem der Nanobiotechnologie, Quelle: http://www.uni-marburg.de/, o.O., Abrufdatum: 10.06.2009, Uhrzeit: 15:05
Hinze T., Sturm M. (2004) Hinze T., Sturm M.: Rechnen mit DNA - Eine Einführung in Theorie und Praxis, München, 2004
Kleesattel W. (2005) Kleesattel W.: Pocket Teacher - Biologie, o.O., 2005
Klußmann N., Malik A. (2007) Klußmann N., Malik A.: Lexikon der Luftfahrt, Berlin, 2007
Laurer M. (2007) Laurer M.: Die Eiweiß-Scheibe, Quelle: http://www.stern.de/, o.O., 2007, Abrufdatum: 10.06.2009, Uhrzeit: 15:15
Linke W. (2000) Linke W.: Faszinierendes Riesenmolekül, Quelle: http://www.uni-heidelberg.de/, o.O., 2000, Abrufdatum: 10.06.2009, Uhrzeit: 15:01
List A. (2007) List A., Bakterien als Langzeitspeicher, Quelle: http://www.photoscala.de/, o.O., 2007, Abrufdatum: 30.05.2009, Uhrzeit: 18:48
M. Mansuripur, et al. (o.J.) M. Mansuripur, P.K. Khulbe, S.M. Kuebler, M.S. Giridhar, N. Peyghambarian: Information Storage and Retrieval using Macromolecules as Storage Media, Quelle: http://www.optics.arizona.edu, Arizona (USA), o.J., Abrufdatum: 19.05.2009, Uhrzeit: 21:26
Nachtigall W. (2002) Nachtigall W.: Bionik: Grundlagen und Beispiele für Ingenieure und Naturwissenschaftler, Berlin, 2002
Neebe M. (2003) Neebe M.: Bakteriorhodopsin al multifunktionales photochromes Farbpigment für die Sicherheitstechnik, Dissertation, Marburg/Lahn, 2003
Phänotyp (o.J.) Phänotyp, Quelle: http://www.biosicherheit.de/, o.O., o.J., Abrufdatum: 25.02.2009, Uhrzeit: 20:35
Quarks & Co (2003) Einheitswährung DNA, Quelle: http://www.wdr.de/, o.O., 2003, Abrufdatum: 12.05.2009, Uhrzeit: 20:21
Salleh A. (2006) Salleh A.: DVD uses bug protein to store data, Quelle: http://www.abc.net.au/, o.O., 2006, Abrufdatum: 10.06.2009, Uhrzeit: 15:09
Sengbusch P. (2003) Sengbusch, Peter v.: Was erkennt man mit dem Mikroskop? - Zellen und Gewebe, Quelle: http://www.biologie.uni-hamburg.de/, o.O., 2003, Abrufdatum: 29.05.2009, Uhrzeit: 22:58
Zimmer D. (2005) Zimmer D.: Jenseits der Gene. Proteine - Schlüssel zum Verständnis des Lebens, Stuttgart, 2005
Persönliche Werkzeuge