Inhalte
Kürzlich berichteten wir darüber wie KI die Produktivität von PLM und die Zusammenarbeit verbessern kann. In diesem Artikel möchten wir näher darauf eingehen und unsere Erfahrungen teilen. KI im Allgemeinen und maschinelles Lernen im Besonderen haben sich seit Kiri Wagstaffs 2012 erschienenem Artikel ‘Machine Learning that Matters’ [1] erheblich weiterentwickelt. Google nutzt KI zur Erkennung von Hausnummern in Street-View-Bildern [2] und die Citigroup zur Erfassung von ungewöhnlichen Zahlungsvorgängen [3] – und das sind keine Einzelfälle mehr. In vielen Unternehmen spielen Anwendungsbereiche eine zentrale Rolle bei den KI-Aktivitäten. Dabei werden bereits im Vorfeld Überlegungen zu Strategien für einen effizienten Einsatz und Upgrades einbezogen.
Bei der Entwicklung von KI-Lösungen für Unternehmen geht es um weit mehr als nur um die Programmierung eines Algorithmus. Im Folgenden erläutern wir die Herausforderungen, mit denen wir bei der Arbeit an unserer KI-fähigen Suchkomponente konfrontiert waren, die in die TECHNIA Value Components für die 3DEXPERIENCE®-Plattform von Dassault Systèmes integriert ist, und wie wir das gelöst haben.
Es gibt zwei Faktoren, die über den Erfolg und die Akzeptanz von Unternehmenssoftware entscheiden: die Benutzerfreundlichkeit für Endbenutzer und die einfache Implementierung und Wartung für Administratoren. Diese Aspekte scheinen vielen Programmierern von Maschinellem Lernen, die z.B. Lösungen in Jupyter-Notebooks entwickeln, fremd zu sein. Machine Learning im Besonderen und KI im Allgemeinen haben jedoch inzwischen ein Stadium erreicht auf dem Datenpipelines, Implementierungsstrategien, die automatische Auswahl von geeigneten Modellen und die Informationssicherheit genauso wichtig sind wie der Algorithmus selbst. Wenn die Produktteams diese Punkte richtig angehen, können die Auswahl der passenden Modelle und deren Implementierung Hand in Hand gehen, insbesondere wenn das Produkt für mehrere Kunden entsprechend ihren jeweiligen Bedürfnissen eingerichtet werden soll. Dafür braucht man natürlich ein Team mit der richtigen Mischung aus fundiertem Fachwissen, KI-Expertise, Implementierungserfahrung und einer guten Abstimmung mit dem Team des Kunden.
Zurück zu unserer Lösung für die KI-gestützte Suche: Zunächst einmal interessiert uns nicht die Technologie, sondern die Frage, ob es denn tatsächlich einen Bedarf dafür gibt. Wer die Datenbank eines Unternehmens durchsucht, wundert sich oft, wie schwierig es ist, bestimmte Inhalte zu finden. Warum kann das Sucherlebnis in Unternehmensanwendungen nicht genauso gut funktionieren wie auf den einschlägigen E-Commerce-Websites? Mitarbeiter in großen multinationalen Unternehmen stehen außerdem vor dem Problem, wie sie Dokumente oder Informationen zu bestimmten Teilen finden können, die ursprünglich in einer anderen Sprache erstellt wurden.
Das folgende kurze Video skizziert das Problem und zeigt anhand eines einfachen Beispiels mit einem realen Datensatz auf, wie effektiv unsere Lösung ist.
Traditionelle Suchmaschinen in Unternehmensanwendungen beruhen auf modifizierten Bag-of-Words-Modellen. Methoden wie BM25 [4] gibt es seit mehr als 20 Jahren, sie sind auch durchaus erfolgreich und bilden die Grundlage für beliebte Suchlösungen [5]. Aber die Grenzen werden schnell deutlich, wenn man sie mit neueren Lösungen vergleicht, die die „Bedeutung“ von Sätzen erfassen können.
Das zeigt sich, wenn ein Benutzer z.B. die Frage stellt: „Wenn ich Produkte so leicht auf E-Commerce-Websites finden kann, warum kann ich die Teile und Dokumente nicht genauso in meinem PLM-System finden“. Außerdem stoßen Bag-of-Words-Modelle auf Schwierigkeiten, wenn sie in einer mehrsprachigen Umgebung eingesetzt werden. Daher stellten wir uns die Frage: „Kann die bestehende Suchfunktion durch moderne KI-Lösungen ergänzt werden?” Zu unserer Überraschung gab es keine zuverlässige Standardlösung auf dem Markt. Also haben wir selbst eine entwickelt.
Wir wollten ein ausgewogenes Verhältnis zwischen den Vorzügen herkömmlicher Suchlösungen und den zusätzlichen Vorteilen von KI-Lösungen schaffen.
Die semantische Informationssuche hat durch den Einsatz neuer auf Worteinbettungen [6] und Transformers [7]. basierender KI-Lösungen einen bedeutenden Schritt nach vorne gemacht. Unsere Herausforderung bestand darin, diese Fortschritte in die bestehende Suchlösung in 3DEXPERIENCE zu integrieren, (Abb. 1) und dabei gleichzeitig dem Administrator die Implementierung zu erleichtern und dem Endnutzer ein besseres Nutzererlebnis zu bieten.
Abb.1: Unser Ansatz kombiniert die bestehende stichwortbasierte Suche mit dem Verstehen natürlicher Sprache und der Bewertung der Nutzerzufriedenheit.
Für die Implementierung bieten wir eine einfache Containerlösung an (siehe Abb. 2), mit der unsere Kunden mehrere Sprachmodelle nacheinander oder parallel ausprobieren und die Ergebnisse auswerten können. Wir haben dafür Microservices verwendet, die eine einfache Skalierung und Evaluierung von Kandidatenmodellen in Kundenumgebungen ermöglichen. So können Kunden zunächst in kleinem Rahmen experimentieren und die Lösung für jedes Infrastrukturszenario skalieren.
Durch eine einfache Konfiguration der Container-Orchestrierung können Kunden sicher auf unsere Repositories (AWS ECR) zugreifen, so dass sie in ihren eigenen Umgebungen experimentieren können. Die Daten verlassen dabei zu keiner Zeit das System des Kunden.
Wir bieten eine integrierte Lösung zum Ressourcenmonitoring und Protokollieren aller Microservices. Wir können auch problemlos Implementierungen auf Servern ermöglichen, die nicht direkt auf unsere Repositories zugreifen können, da die Container separat heruntergeladen werden können.
Abb.2: Vereinfachte Implementierung in Kundenumgebungen, bei der die erste Testphase und die anschließende Produktion mit vereinfachten Upgrades und Skalierung in einem einzigen Ansatz erfolgen können.
Lösungsarchitekten sehen hier sofort, dass diese Lösung problemlos für große Implementierungen skalierbar sind. Zudem können wir bei der Anpassung an die jeweilige Kundeninfrastruktur dank unserer Implementierungsrichtlinien und der Bereitstellung einer detaillierten Dokumentation für die Selbstimplementierung sehr flexibel vorgehen. Wir gestatten auch eine anonymisierte Nutzungsanalyse und eine Feinabstimmung der Modelle in Kundenumgebungen je nach den spezifischen Anforderungen.
Durch all dies macht das Benutzererlebnis mit TECHNIA Value Components noch überzeugender. Damit können wir über die eigentliche Suchfunktion hinaus auch intelligente Workflows und Komponenten für die Zusammenarbeit anbieten. Hier beginnt unsere Reise mit dem Ziel, durch den Einsatz von KI die Produktivität und die Zusammenarbeit der Endnutzer zu verbessern.
[1] K. Wagstaff, „Machine learning that matters,“ arXiv preprint arXiv:1206.4656, 2012.
[2] I. Goodfellow, Y. Bulatov, J. Ibarz, S. Arnoud and V. Shet, „Multi-digit number recognition from street view imagery using deep convolutional neural networks,“ arXiv preprint arXiv:1312.6082, 2013.
[3] „Citi® Payment Outlier Detection Launches in 90 Countries,“ Citigroup Inc., 26 6 2019. [Online]. Available: https://www.citigroup.com/citi/news/2019/190626a.htm.
[4] M. Beaulieu, M. Gatford, X. Huang, S. Robertson, S. Walker and P. Williams, „Okapi at TREC-5,“ Nist Special Publication SP, pp. 143-166, 1997.
[5] S. Connelly, „Practical BM25 – Part 2: The BM25 Algorithm and its Variables,“ Elasticsearch B.V., 19 4 2018. [Online]. Available: https://www.elastic.co/blog/practical-bm25-part-2-the-bm25-algorithm-and-its-variables.
[6] T. Mikolov, K. Chen, G. Corrado and J. Dean, „Efficient estimation of word representations in vector space,“ arXiv preprint arXiv:1301.3781, 2013.
[7] A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. Gomez, Ł. Kaiser and I. Polosukhin, „Attention is all you need,“ in Advances in neural information processing systems, 2017.
Diskutieren Sie weiter und schauen Sie sich das aufgezeichnete Webseminar zum Thema “Gaining Speed, Efficiency and Adoption in 3DEXPERIENCE Using TECHNIA’s Value Components” an.
.