Salesforce hat den weltweit ersten LLM-Benchmark für CRM entwickelt, um Unternehmen die Bewertung von generativen KI-Modellen für Geschäftsanwendungen zu ermöglichen. Der Benchmark evaluiert LLMs (Large Language Models) für Vertriebs- und Service-Anwendungsfälle hinsichtlich Genauigkeit, Kosten, Geschwindigkeit sowie Vertrauen und Sicherheit. Die Bewertungen entstehen auf der Grundlage echter CRM-Datensätze von Salesforce und aus dem Kundengeschäft, sowie Expertenbewertungen sowohl durch Salesforce Mitarbeiterinnen und Mitarbeiter als auch Kundinnen und Kunden.
Bei der Nutzung generativer KI in Geschäftsprozessen stehen Unternehmen vor der Herausforderung, das am besten geeignete Modell für ihre Einsatzzwecke zu identifizieren. »Die größten, leistungsfähigsten Modelle sind oftmals zu kostspielig und liefern mehr, als eigentlich benötigt wird«, so Clara Shih, CEO von Salesforce AI. In vielen Fällen seien Open-Source und/oder kleinere Modelle zu geringeren Kosten für viele Aufgaben mindestens genauso gut geeignet, so Shih weiter. Auch Geschwindigkeit und Benutzerfreundlichkeit bereiten Kopfzerbrechen. Der größte Hemmschuh liegt bei der Datensicherheit, wenn gegebenenfalls vertrauliche Daten in das LLM eingespeist werden. Zu guter Letzt erschwert das exponentielle Wachstum der Modelllandschaft die Übersicht noch weiter.
Spezielle Anwendungsfälle in Vertrieb und Kundenservice
Um Unternehmen die Orientierung zu erleichtern, stellt Salesforce den branchenweit ersten LLM Benchmark für CRM bereit, der speziell für Einsatzszenarien in Vertrieb und Kundenservice optimiert wurde. Er bildet Anwendungsfälle wie Zusammenfassungen von Verkaufschancen, Interessentengewinnung, Vorfallsberichte, wissensbasierte Empfehlungen für Supportantworten und mehr ab. Da andere LLM-Benchmarks akademische und private Anwendungsfälle fokussieren, zu wenige Bewertungen durch Expertenberücksichtigen sowie Kriterien wie Genauigkeit, Geschwindigkeit, Kosten und Vertrauen nicht miteinbeziehen, sind sie für Unternehmen kaum relevant. Deshalb umfasst der Benchmark auch ein öffentlich einsehbares Leaderboard, das Unternehmen dabei hilft, die Effektivität von generativen, KI-gestützten CRM-Lösungen zu beurteilen und informierter zu entscheiden, welches LLM für ihre CRM-Anforderungen am besten geeignet ist.
Der Benchmark wird als dynamisches Framework kontinuierlich weiterentwickelt und ausgebaut. Unternehmen können darauf basierend fundiertere Entscheidungen treffen. Wenn beispielsweise ein Modell bei der Mehrzahl der Kriterien für einen Anwendungsfall geeignet erscheint, kann es im Hinblick auf die Genauigkeit durch Techniken wie Prompt Engineering und Feinabstimmung verbessert werden. Mit der »Einstein 1 Platform« von Salesforce können Kunden aus bestehenden LLMs auswählen oder eigene Modelle für ihre individuellen Anforderungen mitbringen. Der Benchmark unterstützt sie dabei, schneller zu einem erfolgreichen und effizienten Einsatz von KI-gestützten Lösungen zu gelangen.
Die Kriterien im Überblick:
- Genauigkeit: Diese Metrik umfasst die vier Unterkategorien Richtigkeit, Vollständigkeit, Verständlichkeit und die Berücksichtigung der Eingabebefehle/Prompts. Denn nur präzise und korrekte Vorhersagen und Empfehlungen können durch informierte Aktionen in bessere Geschäftsergebnisse und Kundenerfahrungen münden.
- Kosten: Die Messgröße für Kosten bezieht sich auf die geschätzten Betriebskosten, die je nach CRM-Anwendungsfall variieren können, und wird basierend auf Perzentilen in die Kategorien hoch, mittel und niedrig eingeteilt.
- Geschwindigkeit: Die Reaktionsfähigkeit und Effizienz des LLMs bei der Verarbeitung und Bereitstellung von Informationen verbessert das Nutzererlebnis, verkürzt beispielsweise die Wartezeiten für Kunden und ermöglicht es Vertriebs- und Serviceteams, Anfragen und Aufgaben zeitnah zu bearbeiten.
- Vertrauen und Sicherheit: Hierbei geht es um die Fähigkeit des LLMs, sensible Kundendaten abzuschirmen, die Datenschutzbestimmungen einzuhalten, Informationen zu sichern sowie Voreingenommenheit und Toxizität zu vermeiden. Daraus ergibt sich ein Wert für die Zuverlässigkeit von LLMs für CRM, der für mehr Transparenz im Hinblick auf Vertrauen und Sicherheit sorgt. Mit dem Einstein Trust Layer können Unternehmen ihre vertrauenswürdigen Daten und Metadaten unabhängig von dem erreichten Wert in jedem Modell sicher nutzen, ohne dass diese dort gespeichert oder für Trainingszwecke genutzt werden.
»Unternehmen setzen auf KI, um schneller zu wachsen, Kosten zu senken und personalisierte Kundenerfahrungen zu liefern – nicht um einen Kindergeburtstag zu planen oder Othello zusammenzufassen«, sagt Clara Shih. »Unsere Kunden haben nach einer zielgerichteten Methode gefragt, um die Vielzahl neuer KI-Modelle zu bewerten und das richtige für ihre Anforderungen auszuwählen. Unser erster LLM-Benchmark für CRM hilft ihnen, sich in der komplexen Landschaft der Modelle zurechtzufinden. Angelegt als sich dynamisch entwickelndes Framework, ermöglicht es Unternehmen, fundierte Entscheidungen zu treffen und ihre Erwartungen an Genauigkeit, Kosten, Geschwindigkeit und Vertrauen gegeneinander abzuwägen.«
Link zum Benchmark-Tool: https://www.salesforceairesearch.com/crm-benchmark
894 Artikel zu „LLM“
NEWS | EFFIZIENZ | IT-SECURITY | KÜNSTLICHE INTELLIGENZ
Wie Hacker KI und LLMs für ihre Zwecke nutzen
Der Einsatz von KI kann Routineaufgaben automatisieren, Abläufe effizienter gestalten und die Produktivität erhöhen. Dies gilt für die legale Wirtschaft ebenso wie leider auch für die organisierte Cyberkriminalität. Gerade Large Language Models (LLM) werden von kriminellen Akteuren genutzt – weniger als visionäre Alleskönner-Technologien, sondern vielmehr als effiziente Werkzeuge zum Verbessern von Standardangriffen. Seit Ende…
NEWS | KÜNSTLICHE INTELLIGENZ | STRATEGIEN
Die Grenzen der LLM: Wegweisende KI-Technologie ist kein Alleskönner
Large Language Models (LLMs) sind voll im Trend. Ob privat oder in Unternehmen, auf LLMs basierende Chatbots wie beispielsweise ChatGPT von OpenAI generieren mit Deep-Learning-Modellen Texte in menschenähnlicher Weise. Auf Basis von massiven Mengen von Textdaten trainiert, können sie so auf viele Fragen Antworten liefern und Befehle ausführen. Unternehmensentscheider prüfen momentan, welche Vorteile diese Sprachmodelle für ihre Organisation haben und wie man…
NEWS | KÜNSTLICHE INTELLIGENZ | RECHENZENTRUM | SERVICES
TrustLLM: Die europäische KI-Alternative
In Europa entsteht ein Large Languange Model, das zuverlässiger, offener, transparenter und energiesparender sein soll als ChatGPT. Der Schlüssel dazu ist Europas größter Computer, der derzeit in Jülich gebaut wird. Seit das amerikanische Unternehmen OpenAI im November 2022 die Sprachmaschine ChatGPT zugänglich machte, geht das Thema durch die Decke. Können jetzt Personaler ihre Zeugnisse,…
NEWS | EFFIZIENZ | INFRASTRUKTUR | KÜNSTLICHE INTELLIGENZ
Large Language Models (LLMs) und Herausforderungen an den Storage – die Bedeutung von Parallelität und Checkpoints
Wenn man die Nachrichten im Bereich Deep Learning verfolgt, hat man sicher zur Kenntnis genommen, dass die Daten und Modelle im Bereich Deep Learning inzwischen sehr groß sind. Die Datensätze können in der Größenordnung von Petabytes liegen, und die Modelle selbst sind ebenfalls Hunderte von Gigabytes groß. Das bedeutet, dass nicht einmal das Modell selbst…
NEWS | BUSINESS PROCESS MANAGEMENT | ONLINE-ARTIKEL
Das Wasserfallmodell kann zu absurden Prozessen führen
Agile Entwicklungsmethoden zeichnen sich unter anderem durch die hohe Eigenverantwortung aus, die den beteiligten Personen zugestanden wird. Ganz anders dagegen bei der Softwareentwicklung nach dem Wasserfallmodell. Sie ist stark hierarchisch geprägt ist und zwingt die Beteiligten, sich ständig abzustimmen und rückzuversichern. Das führt dazu, dass selbst kleinste Probleme zu aufgeblähten Prozessen ausufern. Der auf Software…
NEWS | TRENDS SECURITY | TRENDS SERVICES | IT-SECURITY | SERVICES
IT-Organisation in der Dienstleistung: Ernstfallmaßnahmen problematisch
Die IT-Sicherheit und der Umgang mit Ernstfällen stellt für die Dienstleistungsunternehmen oftmals einen problematischen Prozess dar. Darüber hinaus stürzt die Performance in der IT-Organisation der Transport und Logistikbranche im Vergleich zum Vorjahr drastisch ab. Das zeigt die Fachbereichsstudie IT-Organisation in der Dienstleistung im Rahmen des Business Performance Index D/A/CH. Der Bericht fasst für Fachbereichsverantwortliche in…
NEWS | DIGITALISIERUNG | TRENDS MOBILE | TRENDS SERVICES | TRENDS 2016
Automatischer Unfallmeldedienst im Auto: Potenzial bei Kfz-Versicherten ist groß
Ab 2018 sind Automobilhersteller verpflichtet, in alle neuen Pkw ein automatisches Notrufsystem einzubauen. Die deutsche Versicherungswirtschaft hat bereits eine Lösung auf den Markt gebracht, die für Neu- und Gebrauchtwagen verwendet werden kann. Hier erkennt ein im Auto eingesetztes System eine Kollision und meldet den Unfall automatisch an eine Notrufzentrale. Das Nutzungspotenzial für solch einen Meldedienst…
NEWS | BUSINESS | IT-SECURITY
DORA: Mehr Resilienz für Banken und Finanzdienstleister
Der Banken- und Finanzsektor kämpft bereits seit langem mit einer wachsenden Zahl von Risiken. Die Folgen der wirtschaftlichen Krise zwischen Mitte 2007 und Anfang 2009 wurde zum Auslöser für eine Reihe von Sicherheitsinitiativen. Ziel war es, die Systeme von Banken und Finanzdienstleistern resilienter und robuster in einem sich ständig weiterentwickelnden Markt zu machen. Die…
NEWS | KÜNSTLICHE INTELLIGENZ | SERVICES
Kann KI wirklich helfen, besser oder schneller zu programmieren?
Künstliche Intelligenz macht Developer schneller. Diese These hat die Cloudflight GmbH im Zuge des diesjährigen Coding Contest überprüft – und kommt zum Ergebnis: nicht für jeden und nicht für jede Aufgabe. Direkt im Anschluss an ihren letzten Cloudflight Coding Contest, Europas größten Programmierwettbewerb, hatte die Cloudflight GmbH im April 2024 unter den Teilnehmenden eine…
NEWS | INDUSTRIE 4.0 | INFRASTRUKTUR | IT-SECURITY | TIPPS
NIS2 und KRITIS-Dach: Neun Bausteine für sichere industrielle Steuerungs- und Automatisierungssysteme
Zahl der durch NIS2 und KRITIS-Dach regulierten Organisationen erweitert sich auf über 30.000: eco Verband gibt 9 Tipps zur Steigerung der Cyberresilienz industrieller Steuerungsanlagen. Mit der zunehmenden Vernetzung von Maschinen werden Industrieanlagen verwundbarer gegenüber Cyberangriffen. Zudem ändert sich die Regulierung dieses Jahr deutlich mit dem KRITIS-Dachgesetz und NIS2-Umsetzungsgesetz: Die Anzahl künftig regulierter Unternehmen erweitert…
NEWS | EFFIZIENZ | NACHHALTIGKEIT | RECHENZENTRUM
Nachhaltigkeit bei Rechenzentren als Teil einer grünen Zukunft
Sektorenkopplung integriert Rechenzentren in umliegende Gemeinden und verbessert die Nachhaltigkeit. Sowohl Unternehmen als auch Verbraucher sorgen für eine kontinuierlich steigende Nachfrage nach Datenverarbeitung und -speicherung und immer mehr Rechenzentren schießen aus dem Boden. Entsprechend wichtig wird ihre Nachhaltigkeit. Verantwortungsbewusste Eigentümer, Betreiber und Nutzer von Rechenzentren schauen sich daher die Auswirkungen ihres Handelns genau an…
NEWS | BUSINESS | FAVORITEN DER REDAKTION | KOMMUNIKATION | SERVICES | STRATEGIEN
Personalentwicklung als Differenzierer für den Unternehmenserfolg
Angesichts des Fachkräftemangels und des demografischen Wandels setzen Unternehmen verstärkt auf das Recruiting von Nachwuchstalenten. Dabei fällt ein wesentlicher Baustein für den Unternehmenserfolg oftmals hinten über: die Entwicklung der eigenen Mitarbeitenden. Denn in den eigenen Reihen schlummern bereits Fähigkeiten und Kompetenzen, die es gezielt weiterzubilden gilt. Um die vorhandenen Skills zu erkennen, Wissenslücken zu schließen…
NEWS | DIGITALISIERUNG | EFFIZIENZ | KÜNSTLICHE INTELLIGENZ | STRATEGIEN | WHITEPAPER
In zwei Jahren werden 85 Prozent der Softwareentwickler generative KI nutzen
Drei von fünf Unternehmen international erachten die Unterstützung innovativer Arbeit als größten Benefit von generativer KI für die Softwareentwicklung. Softwareentwickler erwarten sich vom Einsatz generativer KI eine effektivere Kommunikation mit den Fachabteilungen. Generative künstliche Intelligenz (generative KI / Gen AI) wird Softwareentwickler in zwei Jahren bei voraussichtlich mehr als 25 Prozent ihrer Arbeit in…
NEWS | DIGITALISIERUNG | IT-SECURITY | KOMMUNIKATION
Effiziente Wege des Kunden-Onboardings in Zeiten von eIDAS 2.0
Der Know-Your-Customer-Prozess (KYC) stellt in regulierten digitalen Geschäftsbereichen eine große Herausforderung dar. Komplexe Identifizierungsmethoden und lange Bearbeitungszeiten können zu frustrierten Nutzern führen und sich negativ auf Conversion Rates auswirken. Die Bereitstellung der von den Nutzern bevorzugten Identifizierungsmethode sorgt hingegen für ein nahtloses Erlebnis und verbessert die Conversions. Angesichts der zunehmenden Bedeutung einer sicheren und gesetzeskonformen…
NEWS | KOMMUNIKATION | NEW WORK | TIPPS
Willkommen an Deck: Erfolgreiches Onboarding von Freelancern
Worauf Unternehmen bei der Einarbeitung von externen Fachkräften achten sollten. Der Fachkräftemangel stellt Unternehmen zunehmend vor Herausforderungen: Allein im IT-Bereich fehlen aktuell 149.000 Expertinnen und Experten, mehr als die Hälfte der deutschen Unternehmen beklagt einen akuten Bewerbermangel bei offenen Stellen. Besserung ist nicht in Sicht: Während die Boomer nach und nach in Rente gehen,…
NEWS | DIGITALISIERUNG | KÜNSTLICHE INTELLIGENZ | LÖSUNGEN | STRATEGIEN
Fachkräftemangel: Warum Weiterbildung und Umschulung höchste Priorität haben sollten
Automation Citizen Developers und Citizen Prozess Experts sind gefragt. Die hohen Mitarbeitererwartungen in Kombination mit dem Fachkräftemangel bedeuten, dass Weiterbildungs- und Qualifizierungsprogramme für Unternehmen nicht mehr nur ein »Nice-to-have« sind, sondern eine Notwendigkeit. Es gibt vor allem zwei Gründe, warum moderne Weiterbildungs- und Qualifizierungsinitiativen eine unternehmensweite Priorität sein sollten. Langfristiger Mangel an Fachkräften Automatisierung…
NEWS | INFRASTRUKTUR | IT-SECURITY | RECHENZENTRUM | STRATEGIEN
»Quantenbedrohung sehr ernst nehmen, weil sie sehr ernst ist«
Harald A. Summa warnt vor globaler Quanten-Krise: »Quantencomputer werden in wenigen Jahren alle heute geläufigen Verfahren zur Datenverschlüsselung knacken können. Dann stehen kritische Infrastrukturen im Feuer.« Harald A. Summa, Chairman der Initiative Quantum Leap beim Think Tank Diplomatic Council, warnt vor einer globalen Quanten-Krise (»Quantum Crisis«). Er macht darauf aufmerksam, dass Quantencomputer schon in…
NEWS | DIGITALISIERUNG | KÜNSTLICHE INTELLIGENZ
Generative KI plus RAG: Warum sie Kontext braucht und woher sie ihn bekommt
Mit generativer künstlicher Intelligenz (KI) sollen menschliche Fähigkeiten erreicht oder gar übertroffen werden. Dafür braucht sie Kontext – wie wir Menschen auch. Warum das so ist und wie generative KI an Kontext gelangt, erläutert der Datenbankhersteller Aerospike. Die menschliche Kommunikation ist komplex: Wir drücken uns über Wort, Tonfall und Körpersprache aus. Doch das ist noch…
NEWS | KÜNSTLICHE INTELLIGENZ | SERVICES
Mehr als M365: Wie Partner mit Copilot für Security, Dynamics, Power BI & Co. Neugeschäft generieren können
Microsoft baut das Angebot an KI-Funktionen über alle Produkte hinweg kontinuierlich aus. Für Partner ergeben sich daraus neue Verkaufsargumente und Vertriebschancen. Allerdings dürfen sie ihre Kunden bei der Integration und Nutzung nicht alleinlassen, wenn sie langfristig erfolgreich sein wollen. Auch eineinhalb Jahre nach der Veröffentlichung von ChatGPT ist die Begeisterung für generative KI ungebrochen.…
NEWS | IT-SECURITY | KÜNSTLICHE INTELLIGENZ
Die Datensicherheit mit KI verbessern
Künstliche Intelligenz kann große Datenmengen schnell und präzise analysieren, um Muster und Anomalien zu erkennen. Das ist auch im Security-Bereich sehr hilfreich. Cyberkriminelle sind äußerst findig darin, ihre Angriffsstrategien und -tools immer wieder anzupassen, um an das Wertvollste zu gelangen, das Unternehmen besitzen: Daten. Traditionelle Sicherheitslösungen erreichen schnell ihre Grenzen, wenn es darum geht,…