Bild: ©sebastianreuter/stock.adobe.com
Seagate produziert jedes Jahr mehr als eine Milliarde Wandler in seiner Waferfertigung in Normandale, Minnesota, USA. Um die hohen Qualitätsstandards einzuhalten und Herstellungsfehler früh zu erkennen, müssen die Wandler umfassend analysiert und getestet werden. Die Produktion der Wandler startet mit dem Rohmaterial, das im Wesentlichen ein dünnes Halbleitersubstrat ist. Im Laufe eines fotolithografischen Prozesses wird das Substrat zu einem dünnen, flachen, kristallinen Wafer. Der Wafer wird, wenn er geschnitten und weiterverarbeitet wird, zu einem Wandler (auch bekannt als Schieberegler) – ein Element, das in der Lage ist, Daten auf eine rotierende Magnetplatte zu schreiben und sie zu lesen. Der Testprozess ist lang, komplex und erfordert viel Fingerspitzengefühl. In jedem 200mm-Wafer befinden sich 100.000 Schieber, die überprüft werden müssen. In der Fabrik in Normandale werden täglich Millionen von Mikroskopaufnahmen erzeugt. Das entspricht einem Volumen von 10 Terabyte an Daten, die gesichtet werden müssen, um mögliche Produktionsfehler zu erkennen, bevor die Wafer in Laufwerken verbaut werden.
Nur bekannte Fehler auffindbar
Bisher war es die Aufgabe der Ingenieure, all diese Bilder zu analysieren. Dies birgt ein gewisses Fehlerpotenzial, was dazu führen kann, dass defekte Wandler erst zu einem späteren Zeitpunkt im Herstellungsprozess erkannt werden und dadurch zusätzliche Kosten verursachen. Seagate benötigte eine Lösung, um mehr Bilder in kürzerer Zeit zu überprüfen. Doch selbst das Einstellen von mehr Bildanalyseexperten würde nicht ausreichen, um Millionen von Bildern zu verarbeiten. Schließlich wurde mit einer regelbasierten Bildanalyse zunächst ein erster Automatisierungsgrad erreicht. Mit diesem Ansatz ließen sich einige Anomalien identifizieren – die Voraussetzung dafür war jedoch, dass das System weiß, wonach es suchen muss. Hinzu kam, dass die Regeln manuell eingestellt werden mussten. Dies war ein zeitaufwendiger Prozess, der ständig optimiert und verfeinert werden musste. Das regelbasierte System konnte nur langsam eingerichtet und optimiert werden und lieferte dabei variable Ergebnisse. Abgesehen von einigen Fehlmeldungen des Systems konnte es durch die vorgegebenen Regeln nur bekannte Probleme erkennen. Dies führte zu dem potenziellen Risiko, dass fehlerhafte Wafer vor der Montage in Lese- und Schreibköpfe nicht erkannt werden konnten. Erst die Fortschritte in den Bereichen KI, maschinelles Lernen und Sensoren für das Internet der Dinge führte zu einer Lösung für das Problem.
Eine interne KI-Edge-Plattform
Einer Lösung standen zwei große Herausforderungen im Weg: Das riesige Volumen an Daten, das im täglichen Prozess zu bewältigen war und die Beschränkung bestehender regelbasierter Analyse-Tools, die es zu umgehen galt. Traditionelle Big-Data-Programme arbeiten nach einem Batch-Prozess – dieser eignet sich jedoch nicht für eine Produktionslinie, die rund um die Uhr und 365 Tage im Jahr betrieben wird. Der erste Schritt war der Aufbau eines neuronalen Netzes (Deep Neural Network, DNN), das Erkenntnisse zur Verbesserung der Automatisierung der Erkennung von defekten Wandlern liefern konnte. Das neuronale Netz wurde mit den Grafikprozessoren Nvidia V100 und P4 sowie leistungsstarken All-Flash-Array-Systemen der Reihe Nytro X 2U24 von Seagate entwickelt.