Erfolgreiche Entwicklung und Implementierung von KI-Anwendungen

foto freepik

Es gibt Grundsätze, wie umfassendes System-Design die Rechenleistung und Stabilität ganzer KI-Cluster erhöht.

 

Die Marktforscher von MarketsandMarkets prognostizieren, dass der KI-Markt bis 2027 einen beeindruckenden weltweiten Umsatz von 407 Milliarden US-Dollar erreichen wird – ein deutliches Wachstum gegenüber den geschätzten 86,9 Milliarden US-Dollar im Jahr 2022 [1]. Laut Bitkom sehen 68 % der deutschen Unternehmen großes Potenzial in der KI. Allerdings sehen sich 43 % der befragten Unternehmen als Nachzügler beim Einsatz von KI im Arbeitsalltag, 38 % glauben sogar, den Anschluss an ihre Nutzung völlig verloren zu haben [2]. Es besteht also ein großer Nachholbedarf – und zwar schnell. Doch wie können Unternehmen dies erreichen und die notwendige IT-Infrastruktur schaffen?

Rechenzentren müssen die zukünftigen Anforderungen KI-basierter Anwendungen erfüllen, darunter GenAI, autonomes Fahren, intelligente Diagnostik, algorithmischer Handel und intelligenter Kundenservice. Die zunehmende Datengenerierung und der wachsende Bedarf an Rechenleistung und schnellerer Datenübertragung stellen eine enorme Belastung für ältere IT-Infrastrukturen dar. Bestehende IT-Architekturen sind oft nicht für schnell wachsende Datenmengen und KI-basierte Anwendungen geeignet, da die Entwicklung und der Einsatz von KI-Modellen die Rechenzentren vor mehrere Herausforderungen stellen.

 

Entwicklung und Implementierung von KI-Anwendungen

Bei der Datenverarbeitung in großem Maßstab ist die Effizienz der einzelnen Rechenknoten sehr begrenzt. Daher werden die Zusammenschaltung von Systemen (»Interconnectivity«), die Verwendung von Algorithmen und die Optimierung der Zusammenschaltungen immer wichtiger. Ein systemorientierter Ansatz beim Aufbau der IT-Infrastruktur ist am besten geeignet, um die Hindernisse bei der Einführung von KI zu überwinden. Beim Einsatz von KI sollte der Schwerpunkt deshalb auf der Gestaltung des Gesamtsystems und der Koordination von Algorithmen, Rechenleistung und Daten liegen. Durch die Integration von Rechenressourcen, Datenressourcen, F&E-Einsatzumgebungen und geeigneter Prozessunterstützung, kann die Effizienz und Stabilität der KI-Entwicklung und -Implementierung verbessert werden – vom Cluster-Management über die Trainingsentwicklung bis hin zur Inferenzanwendung. Diese ganzheitliche Optimierung erweitert die Innovationsfähigkeit der Systeme.

Dieser systemzentrierte Ansatz ist notwendig, weil bei der Entwicklung und dem Einsatz KI-basierter Systeme verschiedene Personengruppen zusammenarbeiten, darunter Mitarbeiter aus den Bereichen IT-Infrastruktur, Datenwissenschaft und Unternehmenssteuerung. IT-Infrastrukturexperten legen großen Wert auf die Stabilität von IT-Clustern und die optimale Nutzung von Rechenressourcen. Datenwissenschaftler konzentrieren sich auf die Effizienz und Stabilität des Modell-Trainings. Fachleute aus der Unternehmenssteuerung befassen sich mit dem Inferenzierung und wünschen sich eine einfache Bereitstellung von IT-Dienstleistungen und flexible Rechenressourcen. Während des gesamten Entwicklungsprozesses KI-basierter Systeme könnten Effizienz und Stabilität des gesamten IT-Clusters durch ein systematisches Design verbessert werden – so dass die Unternehmen durchgängig Geschäftserkenntnisse ableiten, Einnahmen generieren und ihre Wettbewerbsfähigkeit erhalten können.

Die größten Herausforderungen bei der Entwicklung und Implementierung leistungsstarker und stabiler KI-Anwendungen sind:

  • GPU-Nutzung

Das Trainieren von Modellen und die Inferenzierung erfordern große Mengen an Rechenleistung, aber die Leistungsfähigkeit von Computerplattformen wächst oft nicht linear mit der Rechenleistung und kann sich verschlechtern. Bei den meisten LLMs (Large Language Models) liegt die modell-basierte Rechenauslastung unter 50 %. Daher müssen Unternehmen einen Weg finden, um Ressourcen und Arbeitslasten durch die Implementierung einer intelligenten GPU-Planung besser zu verteilen. Dies kann über eine Plattform erfolgen, die die Planung der Rechenressourcen auf der Grundlage der Hardwareeigenschaften des Clusters und der Rechenlastcharakteristika optimiert und so die Gesamtauslastung der GPUs sowie die Trainingseffizienz verbessert.

  • Orchestrierung von Aufgaben

Die optimale Planung der Rechenleistung von großen, POD-basierten (Performance Optimized Datacenter) Rechenvorgängen ist eine weitere große Herausforderung. Angesichts der sehr unterschiedlichen und sich dynamisch ändernden Anforderungen an die Rechenressourcen benötigen die Benutzer nicht nur Unterstützung bei der Zuweisung von GPU-Ressourcen, bei der Aufgabenkonstruktion und der Aufgabenplanung. Zudem brauchen sie Optimierungsmethoden zur dynamischen Anpassung der GPU-Ressourcenzuweisung. Ein Ansatz zur Bewältigung dieser Herausforderung ist eine Lösung, die eine schnelle Inbetriebnahme und die entsprechende IT-Umgebung für den Einsatz Hunderter von PODs gewährleistet. Auf diese Weise können der Durchsatz und die Latenzzeit um das Fünffache im Vergleich zu klassischen Schedulern gesenkt werden. Dies gewährleistet eine effiziente Planung und Nutzung von Computerressourcen für umfangreiche Trainings.

  • Geschwindigkeit und Effizienz der Datenübertragung

Ein weiterer Faktor, der die Entwicklung KI-basierter Systeme bremst, ist die Geschwindigkeit und Effizienz der Datenübertragung. Massive Datenmengen stellen eine große Herausforderung für die Datenübertragung dar. Eine angemessene Effizienz bei der Datenerfassung kann die Leistung von GPUs und CPUs maximieren und die gesamte Iterationseffizienz von KI-Modellen verbessern. Innovative Funktionen wie die Unterstützung des lokalen Ladens und Berechnens von Remote-Daten, wodurch Verzögerungen durch Netzwerk-E/A während der Berechnung vermieden werden, können die Datenübertragung enorm beschleunigen. Durch Strategien wie »Zero-Copy«-Datentransfer, Multi-Thread-Abruf, inkrementelle Datenaktualisierung und Affinitätsplanung werden Daten-Caching-Zyklen erheblich reduziert. Diese Verbesserungen optimieren die KI-Entwicklung und die Trainingseffizienz erheblich, was zu einer 2-3-fachen Steigerung der Modelleffizienz beim Datentraining führt.

  • Unterbrechungsfreies Modelltraining

Wenn das Training eines großen Sprachmodells LLM) unterbrochen wird, ist es zeit- und arbeitsintensiv, in den Trainingsprozess einzugreifen und das Modelltraining neu zu organisieren. Häufige Clusteranomalien oder Ausfälle können den Fortschritt der Modellentwicklung stark beeinträchtigen. Beim Trainingsprozess des Sprachmodells Llama 3.1 des Anbieters Meta kam es zum Beispiel alle drei Stunden zu einem Ausfall des Trainingsclusters mit 16.000 GPUs. Ein Cluster-Failback-Mechanismus kann die Ausfallzeiten bei der LLM-Schulung reduzieren, indem er Cluster schnell wiederherstellt, die Verfügbarkeit von Komponenten gewährleistet und Online-Dienste wieder auf den letzten Stand bringt, wodurch der Verlust von Personal- und Zeitressourcen im Modelltrainingsprozess vermieden wird.

  • Einfache Bereitstellung

Die Einsatzschwelle für das Bereitstellungspersonal ist hoch, und die Implementierung ist zeit- und arbeitsintensiv. Fehlendes Fachwissen und mangelnde Erfahrung beim Einsatz von LLMs machen die Implementierung noch schwieriger. Plattformen und Lösungen für die KI-Entwicklung sind wesentlich für die Entstehung sowie den Einsatz der KI-Technologie und haben die Aufgabe, die Schwelle für die KI-Einführung zu senken. Plattformen müssen um Funktionen wie die Feinabstimmung von Low-Code-Modellen, den Low-Code-Einsatz und die Erstellung von Low-Code-Anwendungen erweitert werden, um die Gesamteffizienz der plattform-gestützten KI-Entwicklung zu verbessern. Eine vollständige Handlungsvorlage für den Bereitstellungsprozess kann die schnelle Erstellung und Orchestrierung notwendiger Schritte für verschiedene Geschäftsszenarien unterstützen. Vollumfängliche Handlungsvorlagen und Implementierungsmodelle sind sehr hilfreich für die beschleunigte Bereitstellung von Geschäftsszenarien.

 

»Wir haben gesehen, dass viele unserer Kunden mit KI-Initiativen zu kämpfen haben, die jedoch für ihren Geschäftserfolg unerlässlich sind«, erklärt Louis Tian, CTO von KAYTUS.

»Durch unser anwenderorientiertes Engagement sind wir in der Lage, unsere Kunden von der untersten Hardware- bis zur höchsten Anwendungsebene mit unseren umfassenden KI-Lösungen zu unterstützen. Zusätzlich haben wir bereits unsere umfassende KI-Entwicklungsplattform MotusAI entwickelt. Die Plattform ist für die KI-Entwicklung und -Inferenzierung konzipiert und kombiniert GPU- und Datenressourcen mit KI-Entwicklungsumgebungen, um die Zuweisung von Rechenressourcen, das Aufgabenmanagement und die zentrale Überwachung zu optimieren. Sie beschleunigt die Verarbeitung von Trainingsdaten und verwaltet mühelos die Arbeitsabläufe bei der Entwicklung von KI-Modellen, wodurch die Auslastung der Cluster-Rechenleistung auf über 70 % gesteigert wird. Zudem unterstützt MotusAI auch millionenfach LLM-KI-Inferenzszenarien mit hoher Simultanität.«

 

Fazit

Die allgemeine Herausforderung bei der Einführung von KI, von der Cluster-Entwicklung bis zum Einsatz, besteht darin, wie man Computer-Cluster systematisch konzipiert und optimiert, um die Effizienz und Stabilität der Berechnungen zu verbessern. Für Nutzer von Rechenzentren besteht ein praktikabler Ansatz aus mehreren Prozessschritten. Erstens ist die für KI optimierte Hardware einschließlich Servern, Speichern und Netzwerken für sie von grundlegender Bedeutung. Zweitens sollten sie eine Clusterlösung entwerfen und einsetzen, die bezüglich Verarbeitung, Vernetzung und Speicherung den grundsätzlichen Rechenanforderungen KI-basierter Anwendungen gerecht werden können. Drittens sollten sie eine Plattform für den intelligenten Betrieb und die effiziente Verwaltung des IT-Clusters nutzen, und viertens sollten sie die Anwendung durch verschiedene Optimierungsprozesse verbessern – einschließlich der Entwicklung, des Testens und der Abstimmung von Algorithmen, Codes, parallelen Berechnungen und mehr. Um diese Herangehensweise zu professionalisieren, können Nutzer auch einen zuverlässigen Lösungspartner bzw. Anbieter für die einfache Bereitstellung und den einfachen Betrieb der KI-Anwendungen wählen.

 

[1] https://www.marketsandmarkets.com/Market-Reports/artificial-intelligence-market-74851580.html
[2] https://www.bitkom.org/Presse/Presseinformation/Deutsche-Wirtschaft-drueckt-bei-Kuenstlicher-Intelligenz-aufs-Tempo
Weitere Informationen zur IT-Infrastruktur für Rechenzentren finden Sie unter: https://www.kaytus.com/de/

 

139 Artikel zu „Entwicklung und Implementierung von KI-Anwendungen“

Stromreduzierende Ansätze für eine nachhaltige GenAI-Entwicklung

Generative KI verbraucht Strom, sogar sehr viel Strom. Vor allem das Training der großen Sprachmodelle erfordert aufgrund der benötigten Rechenleistung eine enorme Menge an Energie. Dell Technologies nennt wichtige Maßnahmen, um den Verbrauch und die Umweltauswirkungen zu reduzieren. Stattliche 1.287 Megawattstunden soll 2020 das Training des Sprachmodells GPT-3 laut Forschern von Google und der Universität…

Diskriminierung in KI-Anwendungen verhindern

Viele Menschen stehen künstlicher Intelligenz skeptisch gegenüber, weil sie Algorithmen für ungerecht oder voreingenommen halten. Dass diese tatsächlich diskriminierende Entscheidungen treffen können, haben einige Beispiele in den vergangenen Jahren gezeigt. Pegasystems, ein führender Anbieter von strategischen Software-Lösungen für Vertrieb, Marketing, Service und Operations, erklärt, wie Unternehmen Vorurteile und Diskriminierung in ihren KI-Anwendungen verhindern.   Ende…

KI-Schub für Unternehmen: Sechs Entwicklungen, die zeigen, wie künstliche Intelligenz Prozesse im Alltag beflügeln

KI-Einsatzmöglichkeiten im Zusammenspiel mit Unternehmensanwendungen. Dass künstliche Intelligenz (KI) eines der Trendthemen schlechthin ist, steht außer Frage. Eine aktuelle PwC-Studie kommt jedoch zu dem Ergebnis, dass erst sechs Prozent der Unternehmen in Deutschland KI einsetzen oder implementieren – es gibt demnach immensen Nachholbedarf. Oracle hat jetzt Anwendungsbereiche im ERP- und Geschäftssoftware-Umfeld zusammengestellt, in denen KI…

Fünf Tipps zur Implementierung von Field-Service-Management-Lösungen in KMU

Field-Service-Management-Lösungen bieten für Unternehmen viele Vorteile – von erhöhter Produktivität bis hin zu mehr Effizienz. Die Implementierung solcher Lösungen ist allerdings auch mit Herausforderungen an Management und Belegschaft verbunden. Vor allem mittelständische Unternehmen mit begrenzten Ressourcen scheuen häufig die nötigen Investitionen. Dabei überwiegen mittelfristig die Vorteile solcher Lösungen. Bereits nach durchschnittlich neun Monaten haben sich…

Die Nachfrage nach Daten wird sich bis 2026 verdreifachen

Studie unterstreicht die entscheidende Rolle der Dateninfrastruktur für den Erfolg von KI und zeigt Lücken in den Bereichen Data Governance, Sicherheit und Nachhaltigkeit auf.   KI erobert praktisch alle Branchen mit atemberaubender Geschwindigkeit. Welche Auswirkungen das Wachstum der künstlichen Intelligenz auf Dateninfrastrukturen hat, wo Unternehmen aktuell stehen und welche Herausforderungen auf sie zukommen, hat Hitachi…

Erklärbare KI für die personalisierte Finanzplanung

Das Zeitalter der künstlichen Intelligenz (KI) ist selten offensichtlicher zu sehen als in der Finanzwelt. Ein Beispiel ist eine große australische Bank, die nach einer KI-basierten Lösung für die Herausforderungen bei der Kreditentscheidung suchte. Sie ging über die typischen Erfahrungen mit Kreditbüros hinaus, um umfassende Kreditbewertungen zu ermöglichen. Es wurden soziale Medien und Live-Daten-Feeds integriert,…

Innovative Lösungen für Stromversorgung und Kühlung – Neue Herausforderungen und Chancen für Rechenzentren

Künstliche Intelligenz (KI) und High-Performance-Computing (HPC) – diese beiden Technologien verändern nicht nur die Art und Weise, wie die Zukunft gestaltet wird, Produkte entwickelt werden und neue Geschäftsmodelle entstehen. Ihr Einsatz führt auch zu einem noch nie dagewesenen Bedarf an Energie und Kühlung in Rechenzentren. Laut einer aktuellen Studie der German Datacenter Association hat sich seit 2010 die Rechenleistung, die Unternehmen benötigen, aufgrund der fortschreitenden Digitalisierung verzehnfacht [1]. Weltweit wird sich der Strombedarf von Rechenzentren bis 2026 voraussichtlich verdoppeln [2]. Um gleichzeitig die anvisierten und vom Gesetzgeber geforderten Nachhaltigkeitsziele zu erreichen, braucht es im Bereich Stromversorgung und Kühlung innovative Lösungen.

KI in deutschen Unternehmen – Enormes Potenzial

Die Ergebnisse der Studie »Unlocking Europe’s AI Potential in the Digital Decade«  zeigen, dass Unternehmen in Deutschland das Potenzial von KI erkennen und immer häufiger von den Vorteilen der Technologien profitieren. Die Unternehmen zeigen sich sehr zufrieden mit den Auswirkungen durch die Einführung von KI, da KI zur Steigerung ihres  Unternehmenswerts beiträgt, die Produktivität erhöht…

Datenintensive Geschäftsmodelle brauchen professionelle Data Governance

Viele moderne Unternehmen sind einem großen Effizienzdruck unterworfen und müssen ihre Prozesse stark anpassen, um wettbewerbsfähig zu bleiben. Dabei setzen sie verstärkt auf datenbasierte Geschäftsmodelle, immer häufiger auf KI-Technologien. Verstärkte Nutzung und Abhängigkeit von digitalen Daten erfordern eine besonders akkurate, konsistente und regelkonforme Datenverarbeitung und -verwaltung. Das ideale Mittel dazu ist Data Governance, der systematische…

Vom Hype zur Umsetzung: Sechs Schritte für eine langfristig erfolgreiche KI-Strategie

Künstliche Intelligenz verspricht Unternehmen vielfältige Chancen – von der Automatisierung repetitiver Aufgaben bis hin zur Optimierung von Kundenerlebnissen. Doch ohne eine klare Strategie bleibt das Potenzial oft ungenutzt. Andreas Müller, VP Enterprise Sales Central Europe bei Delinea, erklärt, wie Unternehmen KI in sechs Schritten erfolgreich implementieren können.   Immer mehr Unternehmen setzen heute auf künstliche…

Servicing ist das fehlende Puzzleteil für erfolgreiche GenAI-Produkte

Am 7. November 2024 lud Databricks, das Daten und KI-Unternehmen, zum zweiten Mal in die Eisbach Studios nach München und 1.500 Daten- und KI-Führungskräfte aus Deutschland folgten dem Ruf. Die Besucher erhielten Einblicke in wichtige Branchentrends und erfuhren, wie führende Kunden mit der Databricks Data Intelligence Platform geschäftliche Erfolge erzielen.   Neben der Keynote von…

AI Everywhere: »Human-First«-Strategie für die KI-gestützte Zukunft der Arbeit

  Die Studie zeigt, dass Unternehmen eine KI-DNA entwerfen, KI-Orchestratoren schaffen und in Experten statt in Manager investieren müssen – und das als Teil einer dreistufigen Vorgehensweise.   Unit4, ein Anbieter von cloudbasierten Unternehmensanwendungen für kunden- und mitarbeiterorientierte Organisationen, hat einen von Unit4 gesponserten IDC InfoBrief mit dem Titel «The Path to AI Everywhere: Exploring the…

Cybersicherheit: Künstliche Intelligenz muss jetzt messbare Ergebnisse liefern

Diese 3 Fragen gehören auf die Liste jedes CISO.   Im Juli erlebte die Wall Street ihren schlimmsten Tag seit 2022, als der technologieorientierte Nasdaq um 3,6 % fiel. Der Rückgang wurde größtenteils durch die enttäuschenden Quartalszahlen einiger großer Technologieunternehmen ausgelöst. Besonders auffällig ist, dass die am stärksten betroffenen Unternehmen stark in künstliche Intelligenz (KI)…

Technologie-Prognosen für 2025: KI, Robotics, »Internet Space Race« und die Bedeutung der Konnektivität

  Vom Bergbau auf dem Mond bis hin zu humanoiden Robotern – die DE-CIX Experten Ivo Ivanov (CEO) und Dr. Thomas King (CTO) bewerten einige der spannendsten Trends und das notwendige Zusammenspiel der Kommunikationstechnologien. Fünf Trends, die die vernetzte Geschäftswelt, weitere Technologieentwicklungen und das Interconnection-Geschäft für 2025 – dem Jahr des 30-jährigen Jubiläums von DE-CIX…

Cloud-Sicherheit: Intelligente Cloud-Sicherheit für moderne Finanzunternehmen

Die zunehmende Digitalisierung im Finanzsektor bringt enorme Chancen, aber auch neue Herausforderungen mit sich. Besonders der Einsatz von Cloud-Diensten und künstlicher Intelligenz (KI) bietet viel Potenzial, erfordert jedoch auch robuste Sicherheitsstrategien. Thomas Wethmar, Regional Director DACH bei Skyhigh Security erläutert, wie moderne SSE-Lösungen Finanzunternehmen dabei unterstützen können, Risiken zu minimieren, die Effizienz zu steigern und…

Nachhaltiger Mindset kann die Lebensspanne von Devices verdoppeln

Daten-basierter Device-Refresh kann einen 8-10-jährigen Produktlebenszyklus bei Laptops erzielen– ohne die User Experience zu beeinträchtigen. Ergebnisse belegen auch Nutzerzustimmung: 75 Prozent behalten Devices gerne länger, wenn ihnen die Umweltauswirkungen bewusst sind.   Atos veröffentlicht die Ergebnisse seiner Studie zur »Digital Workplace Sustainability« mit wertvollen Inputs, die Organisationen helfen, bessere Entscheidungen in Bezug auf ihre IT-Infrastruktur…

Daten sammeln, und zwar ab sofort!

Ohne Daten keine KI – so einfach lässt sich die Erfahrung beschreiben, die viele Unternehmen derzeit machen. Eigentlich würden sie gerne datengetrieben arbeiten und mit KI-Anwendungen Themen wie dem Fachkräftemangel, gestörten Lieferketten oder anderen drängenden Problemen entgegenwirken. Doch sobald es an die Umsetzung konkreter Initiativen oder Projekte geht, stellen viele fest, dass ihnen die benötigten…

MISSION KI bringt »AI Founder Fellowship« auf den Weg

Wissing: »Wir wollen, dass Nachwuchstalente in Deutschland gründen.«   Deutschland gehört in der KI-Forschung weltweit zu den Spitzenreitern, doch bei der Umsetzung in marktfähige Anwendungen gibt es Aufholbedarf. Insbesondere bei der Gründung von Startups aus der Wissenschaft liegt Deutschland im internationalen Vergleich zurück. Die vom Bundesministerium für Digitales und Verkehr (BMDV) geförderte Initiative MISSION KI…

Forresters Technologie- und Sicherheitsprognosen 2025

Technologieführer werden die Einführung von AIOps verdreifachen, um technische Schulden zu reduzieren.   Laut Forresters Technologie- und Sicherheitsprognosen 2025 werden 75 % der Technologie-Entscheidungsträger bis 2026 einen Anstieg ihrer technischen Schulden auf ein mittleres oder hohes Niveau erleben. Dies wird auf die rasante Entwicklung von KI-Lösungen zurückzuführen sein, welche die Komplexität von IT-Landschaften erhöhen. Um…

Freiwilliger KI-Mindeststandard

Normen und Standards sind entscheidend für den digitalen Fortschritt und um Vertrauen in die Nutzung neuer Technologien aufzubauen. Der EU AI Act definiert daher strenge Anforderungen an Hochrisiko-Systeme. Von vielen KI-Entwicklungen geht jedoch ein geringes Risiko aus. Um diesen Unternehmen gleichermaßen Orientierung für die Implementierung vertrauenswürdiger KI zu geben, hat die MISSION KI einen freiwilligen…