Niels-Oliver Walkowski

Zur Problematik der Strukturierung und Abbildung von Personendaten in digitalen Systemen

Hat man es mit atomisierten Informationen zu tun, wie z.B bei empirischen Erhebungen, so ist eine wesentliche Frage, mit der man sich auseinanderzusetzen hat, die der Ordnung, in der man diese Informationen festhalten möchte. Diese Ordnung richtet sich wahrscheinlich zunächst nach den semantischen Zusammenhängen der Daten selbst. Berücksichtigt werden muss aber wohl auch der Forschungskontext, innerhalb dessen diese Daten erhoben worden sind, sowie das Ziel, mit dem später auf den Datenbestand zugegriffen werden soll. Dieselbe Frage, also die nach der Strukturierung von Informationen, stellt sich, möchte man Personendaten in einer Datenbank oder einem datenbankähnlichen System ablegen. Um die Informationsordnung – im Kontext von Datenbanken Inhaltsmodell genannt –, die die Berlin-Brandenburgische Akademie der Wissenschaften in ihrem Personendaten-Repositorium verfolgt, und um die Frage, was sie im Umgang mit diesen Daten ermöglicht, soll es im Folgenden gehen.

 

Ich möchte zunächst anschließen an die grundlegende Problematik, auf die meiner Meinung nach die Rede meines Vorgängers aufmerksam gemacht hat und der es sich bei der Ausarbeitung eines Inhaltsmodells zu stellen gilt: Das Auseinanderfallen von Mensch und Person. Nirgendwo sonst als in den Normierungsprozessen des 19. Jahrhunderts wird deutlicher, dass die Person eine soziokulturelle Kategorie ist, gewissermaßen der Niederschlag, den ein Mensch in der gesellschaftlichen Sphäre hinterlässt. Person und Mensch zusammenzuwerfen würde mit Worten Bourdieus bedeuten, Normalität, also die Sphäre von Konventionen, mit Identität zu verwechseln. Personendaten werden in der Sphäre der Konventionen generiert, und repräsentieren die Weise, wie in einer historischen Epoche eine Gesellschaft versucht hat, sich den Menschen verfügbar zu machen. Die bürgerlichen Primärdaten wie Name, Alter, Geschlecht und Religion werden von Bourdieu daher auch als rigide Bezeichner gesehen, die den Zweck haben, Identität zu erzwingen, um so der immerwährenden Bewegung und Fluktuation des wirklichen Lebens entgegentreten zu können. Der Kontigenz von Leben an sich wird mit Prozessen der Identifizierung und der Sinnstiftung durch die Erzegung von Chronologien und Vereinheitlichung zu begegnen versucht. Wie die Beispiele im vorangegangenen Vortrag zeigen, werden diese Versuche jedoch vom wirklichen Leben, welches sich nach Bourdieu am Besten – mit den Worten Macbeths – als ein Leben voll von Lärm und Wut, aber ohne Sinn beschreiben lässt, immer wieder unterwandert. Die Folge sind für das biographische Arbeiten uneindeutige, ungesicherte und sich widersprechende Personendaten.

 

Eine neue Dimension bekommt dieses Problem dadurch, dass biographisches Arbeiten und auch das Personendaten-Repositorium Daten nicht isoliert präsentieren, sondern in einem größeren Zusammenhang mit anderen Daten. Das Organisieren biographischer Aspekte zu zusammenhängenden Gebilden stellt nach Daniel Hutto eine Ästhetisierung und Fiktionalisierung unseres wirklichen Lebens in Narrationen dar. Das bedeutet, dass wir aus dem Material unseres Lebens und dem, was wir dazu machen, Sinnzusammenhänge formen, im Modus und nach den Gesetzmäßigkeiten des Geschichtenerzählens. Dieser Ansatz der Selbst-Philosophie wird ebenfalls von der modernen Biographieforschung aufgenommen, so z.B. von Griese, der von Biographien als narrativen Identitäten spricht. Ordnung entsteht durch die Bestimmung des Anfangs- und Endpunktes der Geschichte, durch das Berücksichtigen und Unberücksichtigtlassen von Lebensaspekten und durch die Art der Gruppierung. Da der Akt des Erzählens ein dem Leben nachgeordneter Prozess ist, stoßen wir hier auf dieselbe Spannung zwischen dem Versuch einer semantischen Fixierung des Lebens und dessen grundsätzlicher Kontingenz. Tatsächlich erzählen wir selbst, die wir uns am besten kennen, unsere eigene Lebensgeschichte immer wieder neu. Wie viel stärker muss da erst das Aufkommen konkurrierender Narrationen sein, wenn Wissenschaftler mit unterschiedlichen Persönlichkeiten und unterschiedlichen Forschungsinteressen aus einer anderen Zeit im Leben eines anderen Menschen Sinn zu stiften versuchen?

 

Was bedeuten die hier kurz zusammengefassten Problemstellungen für ein Personendaten-Repositorium und sein Inhaltsmodell? Wenn man, wie beschrieben, konkurrierende Narrationen, Widersprüchlichkeiten und Uneindeutigkeiten nicht als Ergebnis mangelnder Kenntnis oder noch nicht zum Ziel gekommener Forschung auf dem Weg zu Wahrheit begreift, dann bedeutet es, dass es nicht Aufgabe des Repositoriums sein kann, Klarheit zu schaffen. Ganz im Gegenteil kann es sich als brauchbares Werkzeug für die alltagswissenschaftliche Arbeit gerade dann erweisen, wenn es in der Lage ist, diese Mehrdeutigkeit und Konflikte in der biographischen Erschließung mit abzubilden. Eine weitere Anforderung, die sich für das Inhaltsmodell ergibt, ist, dass es möglichst flexibel sein sollte, um später die Möglichkeit für eine frei gestaltbare Gruppierung und für die Generierung von Interessen- und bedarfsorientierten Sinnzusammenhängen zu ermöglichen. Im Folgenden versuche ich darzustellen, wie wir versucht haben, dem Rechnung zu tragen.

 

Davon ausgehend, dass Personendaten keine Eigenschaften sind, die einem Menschen anhaften, sondern besser als Aussagen zu verstehen sind, die von außen über einen Menschen gemacht werden, macht es keinen Sinn, das Repositorium von der Person her aufzubauen, als Träger einer bestimmte Menge an Datenfeldern. Dieses Prinzip muss gerade auf den Kopf gestellt werden, so dass eine potenziell unbegrenzte Anzahl an Aussagen eine Person konstituiert, weil sie postulieren, in ihrer Aussage dasselbe Objekt zu beschreiben. Im Bemühen, das Datenmodell so flexibel wie möglich zu halten, haben wir uns für die Form der Aussage als abstrakte Form von Personendaten entschieden. Um deutlich zu machen, dass es sich um eine personenbezogene Aussage handelt, nennen wir personenbezogene Daten in unserem System Aspekte. Personendaten stellen daher in Aussagen formulierte Aspekte von Personen dar. Der Vorteil dieses Ansatzes ist, dass wir auf dieser Abstraktionsebene jeden Aspekt erst einmal gleich behandeln können. Außerdem schreibt das System so keine Strukturierung der Daten vor, dem sich die Wissenschaftler, die damit arbeiten sollen, anpassen müssen. Klassifikationssysteme und Informationstypen, für die sich die Wissenschaftler entschieden haben und die bei uns an der BBAW konkret in den Vorhaben existieren, können auf diese Weise mit in das System transportiert werden. Gerade für institutions- oder arbeitsbereichsübergreifende Datenbestände bedeutet das einen erheblichen Mehrwert, da Daten nicht nur für sich, sondern zusammen mit ihren Entstehungskontexten vergleichbar sind. Ein weiterer Vorteil, die Daten auf der Ebene ihres kleinsten Nenners zu atomisieren, ist der, dass sie so später vom Benutzer des Repositoriums im Sinne der Theorie der narrativen Identität beliebig gruppiert und ergänzend strukturiert werden können.

 

Um das ganze etwas plastischer werden zu lassen, zeige ich Ihnen hier die Übersicht über den grundsätzlichen Aufbau eines Aspektes, mit dem wir versuchen, potenziell jede Form von Personendaten abzubilden.

 

Von dieser grundsätzlichen Informationstyp-Neutralität ausgehend lässt sich nun darüber nachdenken, wie eine nähere Bestimmung der hinter dem Aspekt liegenden Information erzielt werden kann. Das Personendaten-Repositorium geht den vorgezeichneten Weg konsequent weiter und klassifiziert nach der sogenannten Bottom-up-Methode. Dies bedeutet konkret, dass keine globale Klassifikation erfolgt, die sagt: Es gibt Aspekte, die beschreiben die Ausbildung, und haben diese oder jene Datenform, und andere, die beschrieben den beruflichen Werdegang, u.s.w. Die Klassifikation erfolgt auf der Ebene der Aspekte selber durch sogenanntes Tagging, vergleichbar der Verknüpfung von OPAC-Einträgen mit Schlagwörtern. Der Vorteil ist, dass die Aspekte auf diesem Wege Teil mehrerer Klassifikationssysteme werden können. Dadurch behält das System seine grundsätzliche Neutralität gegenüber einer spezifischen diskursiven Erschließung von Personen bei. Bottom-up heißt diese Methode deshalb, weil sich das Klassifikationsschema – oder besser: die Klassifikationsschemata – erst durch das Zusammensammeln der Aspekte ergeben, aus denen sie deduziert werden, und nicht vor ihnen existieren.

 

Bisher haben wir nur über Aspekte, also die eigentlichen Personendaten gesprochen, jedoch noch nicht über die Person selbst. Da wir gesagt haben, dass es erst die Personendaten sind, die die Personen generieren, und der Person keine Inhalte an sich zukommen, bleibt die Person auch im Personendaten-Repositorium zunächst ein leeres Objekt. Daher besitzt es keine Pflichtfelder oder Kerninformationen, die fest zu ihm gehören. Die einzigen in ihm direkt enthaltenen Informationen sind Identifikatoren, durch die es sich als Bezugsobjekt für Aspekte anbietet und die es mit anderen Personendaten-Systemen verknüpft. So wird, falls vorhanden, die PND oder LCCN aufgenommen. Ein Aspekt erweist seine Zugehörigkeit zu einer Person dadurch, dass in ihm eine Beziehung zur Person definiert wird. Der Vorteil dieser von der Information ausgehenden Zugehörigkeitsdeklaration besteht unter anderem darin, dass mehrere Beziehungen definiert werden können. Dies erweist sich als sinnvoll, wenn bei einzelnen Personendaten nicht klar ist, wer gemeint ist, oder ich zwei Personenobjekte habe, bei denen nach bisherigem Stand unklar ist, ob sie nicht vielleicht identisch sein könnten. Um solche Diskussionen mit abbilden zu können, kann die Qualität einer Beziehung z.B. als gesichert oder ungesichert mit angegeben werden.

 

Nachdem ich die Probleme für das Inhaltsmodell eines Personendaten-Repositoriums und den Ansatz, mit dem wir versucht haben, diesen Problemen zu begegnen, beschrieben habe, möchte ich nun einen kurzen Ausblick darauf geben, was für Vorteile der Endbenutzer unserer Meinung nach von diesem System haben wird.

 

Verschiedene Gruppen und Einrichtungen erhalten die Möglichkeit, kollaborativ an den Personendaten zu arbeiten, ohne dass die Herkunft und die unterschiedliche Perspektive auf die Daten verloren geht. Personenbeschreibung wird auf diese Weise zu einem vielschichtigen Arbeitsprozess, der der Komplexität der soziokulturellen Konstruktion der Person gerecht wird. Umgekehrt werden Betrachter der Daten die Möglichkeit haben, nur die Daten aus einem spezifischen Entstehungshintergrund oder innerhalb einer vorgegebenen Perspektive zu betrachten, bzw. verschiedene diskursive Erschließungen einer Person nebeneinander stellen und vergleichen zu können. In der Terminologie meines Vortrages heißt das, bedürfnisorientierte Narrationen aus dem vorhandenen Datenmaterial zu erzeugen. Diese flexiblen Strukturierungs- und Darstellungsmöglichkeiten machen es besonders leicht, vorhandene Schwierigkeiten und offene Fragestellungen bei der diskursiven Erschließung einer Person zu erkennen und eine Diskussion darüber vorzubereiten.

 

Der Aspekt-zentrierte Ansatz der Datenerfassung ermöglicht es, die Daten auch anders zu gruppieren als um das Ordnungsprinzip der Person, z.B. wenn man sich die Namen aller Schulen von späteren Landräten in Preußen zwischen 1800 und 1850 anzeigen lassen möchte, und diese etwa nach der Anzahl der Schüler sortiert. Über den Weg der Auswertung der Personeneinträge werden so Informationen höherer Art erzeugt. Dadurch werden in den Daten versteckte Informationen, welche zunächst nicht sichtbar sind, transparent gemacht. Implizites Wissen wird so zu expliziter Kenntnis. Das so gewonnene Wissen wirkt auf die Personendaten zurück, präzisiert ihren Aussagegehalt und erweitert die Erschließung der Person selbst.

 

Durch die Trennung der Personen von den Aspekten im Inhaltsmodell des Repositorium und der Verwendung der Fähigkeit des Systems, Beziehungen auszudrücken, wird eine gute Grundlage für die Bearbeitung von Identitätsproblematiken geschaffen, die sich häufig durch eine ungenaue Datenlage, die Verwendung von Synonymen und die Erfassung von Personen in unterschiedlichen formalen Kontexten ergibt. Durch die Verknüpfung der Person mit Identifizierern kann die Bearbeitung dieser Problematik an andere Identifikationssystemen und Autoritäten angeschlossen werden. Das System weist hierdurch über seinen eigenen Horizont hinaus – ein Prinzip, das auch über Bereitstellung von technischen Schnittstellen erreicht werden soll.

 

Ressourcen

 

Weblinks