Home
   Das Unternehmen
downloadsProdukte & Lösungen
Hybrid-Core Computer
downloads Personalities
Financial Analytics
Proteomics Search
PDK
kontakt Presse
presse Kontakt / Anfahrt
produkte Downloads

Kontakt

HMK Supercomputing GmbH
Frankfurter Str. 111
61476 Kronberg
Telefon: +49 _ 61 73 - 3 25 02 40


Impressum
 

Proteomics Search

Durch die Impelmentierung der Kernelemente der UCSD InsPecT-Proteomics-Suchanwendung in die
HC-1™-Hardware können Forscher jetzt Suchanwendungen in Protein-Datenbanken durchführen, die zuvor entweder nicht praktikabel durchführbar oder sogar unmöglich wären.

Proteomics - die Suche nach der Beschreibung des kompletten Aufbaus der Proteine in einem Organismus - ist wohl eines der wichtigsten Felder auf dem Gebiet der Biowissenschaften. Wenn man versteht, wie Krankheiten Proteine in und um die Zellen verändern, können Wissenschaftler Methoden entwickeln, um entweder neue Marker für die Diagnostik oder neue Angriffspunkte für die Arzneimittelentwicklung zu finden. Das Ziel ist es letztlich herauszufinden, wie und warum Krankheiten - wie zum Beispiel Alzheimer - Proteine verändern, um dann Wege zu finden, diese Krankheiten zu heilen oder zumindest ihre zerstörerische Wirkung zu lindern oder aufzuheben.

Dies ist aber eine Herculesaufgabe. Ein Protein ist eine langes organisches Molekül, das sich aus hunderten oder tausenden von sehr kleinen (7 bis 24 Atome) Molekülen von Aminosäuren zusammensetzt. Wissenschaftler müssen diese Aminosäuresequenzen in den verschiedenen Proteinen der verschiedenen Zellen eines Körpers identifizieren und katalogisieren, um dann die Unterschiede zwischen einer gesunden und einer kranken Zelle vergleichen zu können.

Die Katalogisierung beginnt mit der Analyse einer organischen Probe mit einem Massenspektrometer (MS). Das MS erzeugt ein für die Aminosäurensequenzen in der Probe repräsentatives Tandem-Massensprektrum (MS/MS). Dieses Spektrum wird dann genutzt, um große Datenbanken bekannter Proteine bei einem ausgewählten Organismus (z. B. dem Mensch) zu durchsuchen. Das experimentell gewonnene Spektrum wird dabei gegen jede mögliche Teilmenge der Einträge in der Datenbank verglichen. Die besten Treffer (die am höchsten bewerteten Mustersequenzen) definieren dann mögliche Proteine, die schließlich in die engere Wahl für weitere Untersuchungen kommen.

Die Herausforderung - einmal von der reinen Zahl von Vergleichsmöglichkeiten gegenüber der Datenbank und der Erzeugung der Spektren durch die Datenbankeingaben abgesehen - ist, dass viele Proteine post-translationale Modifikationen (PTMs) erfahren, durch die deren Eigenschaften zutiefst verändert werden und durch die die Komplexität der Suche extrem erhöht wird.

Bis vor Kurzem mussten Algorithmen zur Protein-Datenbanksuche entweder PTMs ignorieren, oder konnten einige bekannte PTMs als gegeben annehmen und konnten diese so in die Untersuchungskriterien einbeziehen. Wie auch immer, die Natur einer Krankheit und die Suche nach einem passenden Heilmittel ist es, dass diese Veränderungen unbekannt sind. In anderen Worten: Die Datenbank-Suchkriterien sind nicht exakte Treffer, sondern für Treffer die “close” sind. Um aber eine schnelle und zuverlässige Datenbanksuche zu erreichen, die auch die PTMs mit einbezieht, entwickelten Wisssenschaftler des Computer Science Departments der Universität of California in San Diego eine Anwendung mit dem Namen “InsPecT/MS-Alignment”. Das Herz von InsPecT ist ein Vergleichs- und Bewertungsalgorithmus, der den größten Teil der Rechenzeit in der Anwendung in Anspruch nimmt. Während des Vergleichs- und Bewertungsprozesses werden Daten aus der Proteindatenbank aus dem Hauptspeicher gelesen und die Massen der Aminosäuren akkumuliert um Vergleichsmuster zu erhalten. Der Unterschied zwischen den Massen jedes Vergleichsmusters mit dem Beispielmuster wird als mögliche Modifikation des Proteins verbucht. Das Vergleichsmuster wird  dabei viele Male bewertet, jedes Mal mit einer Modifikation einer anderen Aminosäure. Die Bewertungen werden dabei kontinuierlich aktualisiert, die Muster mit den höchsten Bewertungen repräsentieren dabei die Muster mit der höchsten Trefferquote.

Ingenieure von Convey implementierten zusammen mit den Wissenschaftlern der UCSD den Vergleichs- und Bewertungsalgorithmus in der Conveyhardware als eine Convey-Personality. In der Convey-Implementierung nutzt jeder dieser Schritte speziell zugewiesene Hardware Ressouren auf dem Convey-Coprozessor.

Der Speicher des Convey-Coprozessors erlaubt sehr schnelle “table-lookups” und kann in Kombination mit der pipelineähnlichen Implementierung der Hardware in jedem Clock-Zyklus eine Bewertung durchführen. Ein konventioneller Prozessor benötigt dazu im Vergleich hunderte von Zyklen, um die gleiche Aufgabe zu erledigen. UC San Diego schätzt, dass die Laufzeit der Anwendung um den Faktor 100 im Vergleich zu einem konventionellen Prozessor reduziert werden kann, und dies nachdem acht Racks von Standardservern durch ein Rack eines HC-1 Servers ersetzt worden ist. Conveys innovativer Hybrid-Core-Computer verbindet so die niedrigen Kosten und das einfache Programmieren eines gewöhnlichen Systems mit der Performance einer maßgeschneiderten Hardwarearchitektur.


© HMK Supercomputing GmbH - Frankfurter Str. 111 - 61476 Kronberg