TechTalk: Darum sollte die Storage-Infrastruktur mit der KI Schritt halten können

Warum spielt die Storage-Infrastruktur im Kontext der Künstlichen Intelligenz eine immer größere Rolle, und welchen Beitrag leistet IBM hierbei? Das wollten wir auf der ISC High Performance 2025 in Hamburg von Robert Haas wissen. Herausgekommen ist dieses knapp 2-minütige Video.

 


Why does storage play such a critical role within the Al space?

What we find particularly interesting today is that AI is not only the source of all this data that we can create in very large scale, but it’s also the way for us to search that data that we’ve created in ways that makes it more relevant.

So it’s not only the problem, it’s also the key to the solution. And this is why retrieval augmented generation is becoming very popular to integrate that proprietary content. And this is why storage solutions have now to be adapted in order to do this in an efficient fashion. And this is a very important topic for us in research and development at IBM and elsewhere at the moment, as you can imagine.


What is IBM’s contribution to this Al driven storage space?

So IBM at the moment, based on its well-known spectrum storage scale technology, is developing an extension that we call content-aware storage, or CAS, that enables us precisely to take advantage of the propriety information that a company may have at its disposal and use it to enrich the insights that are generated by the large language models (LLM).

Using a technology called retrieval augmented generation, or RAG, which is very popular these days, but which we implement in such a way that we don’t introduce unnecessary copies of the data, nor do we expose, beyond the access control, the original access control of that data, to parties that should not have access to it. Which is critical, but this insight generated with your own company information should not be available to others, clearly.

 

Deutsche Übersetzung


 


Warum spielt Speicher im KI-Bereich eine so wichtige Rolle?

Was wir heute besonders interessant finden, ist, dass KI nicht nur die Quelle all dieser Daten ist, die wir in sehr großem Umfang erstellen können, sondern auch die Möglichkeit, diese von uns erstellten Daten so zu durchsuchen, dass sie relevanter werden.

Sie sind also nicht nur das Problem, sondern auch der Schlüssel zur Lösung. Aus diesem Grund wird Retrieval Augmented Generation immer beliebter, um diese proprietären Inhalte zu integrieren. Und deshalb müssen die Speicherlösungen jetzt angepasst werden, um dies auf effiziente Weise zu tun. Wie Sie sich vorstellen können, ist dies ein sehr wichtiges Thema für unsere Forschungs- und Entwicklungsarbeit bei IBM und anderswo im Moment.


Was ist der Beitrag von IBM zu diesem KI-gesteuerten Speicherbereich?

IBM entwickelt derzeit auf der Grundlage seiner bekannten Spectrum Storage Scale-Technologie eine Erweiterung, die wir als Content Aware Storage oder CAS bezeichnen und die es uns ermöglicht, die firmeneigenen Informationen, über die ein Unternehmen möglicherweise verfügt, zu nutzen und sie zur Anreicherung der Erkenntnisse zu verwenden, die von den großen Sprachmodellen (LLM) generiert werden.

Wir verwenden eine Technologie namens Retrieval Augmented Generation (RAG), die heutzutage sehr populär ist, die wir aber so implementieren, dass wir weder unnötige Kopien der Daten einführen noch die ursprüngliche Zugangskontrolle zu diesen Daten über die Zugangskontrolle hinaus für Parteien offenlegen, die keinen Zugang dazu haben sollten. Das ist wichtig, aber diese Erkenntnisse, die mit Ihren eigenen Unternehmensdaten gewonnen werden, sollten natürlich nicht für andere zugänglich sein.

 

Weitere Artikel zu