Wenn Excel "mitdenkt": 20% aller Genetik-Forschungen fehlerhaft

Dns, Dna, Erbmaterial Bildquelle: Christoph Bock (Max Planck Institute for Informatics, CC BY-SA 3.0)
Microsofts Office-Software ist weit verbreitet und ermöglicht in vielen Situationen auch ein recht bequemes Arbeiten. Die Eigenarten der Software führt aber auch immer wieder zu Problemen - so sorgt etwa Excel dafür, dass sehr viele wissenschaftliche Veröffentlichungen fehlerhaft sind.
Aktuell rückt hier aufgrund einer neuen Untersuchung die Arbeit der Genetik in den Mittelpunkt. Immerhin, so könnte man sagen, sind hier diesmal nicht Bugs in der Tabellenkalkulation verantwortlich, die in anderen Fällen bereits zu problematischen Rechenergebnissen führten. Trotzdem kam man zu dem Schluss, dass rund 20 Prozent aller Veröffentlichungen aus der Gen-Forschung in der vorliegenden Form fehlerhaft sind.

Die Ursache sind hier automatische Formatierungen, die von Excel vorgenommen werden, wenn der Nutzer die Standard-Einstellungen nicht ändert. Die meist automatisiert aus anderen Datenquellen übertragenen offiziellen Bezeichnungen von Genen werden durch die Microsoft-Software falsch interpretiert und in andere Schreibweisen umgewandelt.

Das Gen "Septin 2" wird in der formalen Schreibweise der Wissenschaft als SEPT2 vermerkt. Excel meint darin allerdings ein Datum zu erkennen und baut den Eintrag in "2-Sep", also den 2. September, um - zumindest in der englischen Sprachversion, die in der international organisierten Wissenschafts-Community aber ohnehin meist zum Einsatz kommt. In der Durchsicht zahlreicher Paper wurde aber auch eine automatische Umformatierung in "2006/09/02" gefunden.


Ähnlich sieht es bei einer anderen Gensequenz aus, die mit vollem Namen "Membrane-Associated Ring Finger (C3HC4) 1, E3 Ubiquitin Protein Ligase" heißt. Die offizielle Kurzform lautet hier MARCH1, was Excel zu 1-Mar ändert, also ebenfalls in eine voreingestellte Datum-Schreibweise. Nicht besser wird es, wenn die RIKEN-Schreibweise zum Einsatz kommt. Hier lautet beispielsweise eine Gen-Kennung "2310009E13", was Excel dann als Fließkommazahl identifiziert und in "2.31E+13" umwandelt.

Anders als falsche Berechnungen, die in der Vergangenheit auch schon auftauchten, führt dieses Problem nicht direkt zu falschen Schlussfolgerungen der Forscher. Schwierig wird es allerdings, wenn nun andere Wissenschaftler auf den Arbeiten ihrer Kollegen aufbauen und mit den bereits vorhandenen Daten weiterarbeiten wollen - und das ist immerhin eine der grundlegenden Funktionsweisen der Forschung. Das ist dann nicht oder nur mit großem Aufwand möglich.

Mit ihrer Untersuchung wollen die Autoren der Studie in erster Linie darauf aufmerksam machen, dass dieses Problem vorhanden ist. Im Grunde gibt es zwei Lösungsmöglichkeiten: Entweder die Genetiker eignen sich bessere Kenntnisse über den Umgang mit Excel an, um vor der Übertragung von Daten erst einmal alle Autokorrekturen abzuschalten - oder aber man greift dann doch besser auf geeignetere, wenn vielleicht auch weniger bequeme Werkzeuge zurück.

Download
Excel Viewer - Excel-Dateien öffnen, anschauen und drucken
Dns, Dna, Erbmaterial Dns, Dna, Erbmaterial Christoph Bock (Max Planck Institute for Informatics, CC BY-SA 3.0)
Diese Nachricht empfehlen
Kommentieren78
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Kommentar abgeben Netiquette beachten!

Jetzt als Amazon Blitzangebot

Ab 19:30 Uhr Weihnachten Familien Collection (6 wunderschöne Weihnachtsfilme für die ganze Familie zum Fest) [6 DVDs]
Weihnachten Familien Collection (6 wunderschöne Weihnachtsfilme für die ganze Familie zum Fest) [6 DVDs]
Original Amazon-Preis
23,97
Im Preisvergleich ab
?
Blitzangebot-Preis
10,00
Ersparnis zu Amazon 58% oder 13,97
Nur bei Amazon erhältlich

Video-Empfehlungen

WinFuture Mobil

WinFuture.mbo QR-Code Auch Unterwegs bestens informiert!
Nachrichten und Kommentare auf
dem Smartphone lesen.

Folgt uns auf Twitter

WinFuture bei Twitter

Interessante Artikel & Testberichte

WinFuture wird gehostet von Artfiles

Tipp einsenden