DeepSeek’s AI Models Stir Controversy and Collaboration with Microsoft

DeepSeek : DeepSeek's AI Models Stir Controversy and Collaboration with Microsoft

DeepSeek, ein chinesisches Unternehmen, hat kürzlich mit seinen KI-Modellen für Aufsehen gesorgt. Diese Modelle sind nun in Microsofts Azure AI Foundry und über Github verfügbar. Microsoft-Kunden können das Modell R1 in ihre Dienste integrieren. Gleichzeitig untersucht Microsoft, ob DeepSeek gegen Nutzungsbedingungen verstoßen hat.

Microsoft hat in seinem Azure-Portfolio etwa 1800 KI-Modelle. DeepSeek R1 wird auf einer Plattform angeboten, die es Unternehmen ermöglicht, fortschrittliche KI nahtlos zu integrieren. Diese Plattform ist skalierbar und unternehmenstauglich, unterstützt durch Microsofts Zuverlässigkeit und Innovation. Microsoft lobt auch die Kosteneffektivität von R1, da es mehr Menschen ermöglicht, moderne KI-Fähigkeiten mit minimalen Investitionen zu nutzen. Dies könnte ein Hinweis auf die Konkurrenz zu OpenAI sein.

Microsoft war bisher ein großer Investor in OpenAI. OpenAI musste bisher die Infrastruktur von Microsoft nutzen. Kürzlich wurde dieser Vertrag gelockert. OpenAI kann nun auch andere Cloud-Anbieter nutzen. Dies könnte den Bau eines großen Rechenzentrums im Rahmen des Projekts Stargate betreffen, das OpenAI zugutekommen soll.

Azure AI Foundry ermöglicht es Nutzern, KI-Modelle direkt zu testen und zu vergleichen. Dies richtet sich vor allem an Geschäftskunden. DeepSeek R1 wurde vor der Integration zahlreichen Sicherheitstests unterzogen, so Microsoft.

Microsoft und OpenAI haben eine Untersuchung gegen DeepSeek eingeleitet. Der Vorwurf lautet, dass DeepSeek unerlaubt auf Daten von OpenAI zugegriffen hat. Sie sollen die API von OpenAI genutzt haben. Microsoft entdeckte im Herbst verdächtige Aktivitäten. In OpenAIs Nutzungsbedingungen steht, dass es verboten ist, den Output zu nutzen, um eigene Modelle zu entwickeln, die mit denen von OpenAI konkurrieren. Genau das wird DeepSeek vorgeworfen.

Mehrere KI-Experten vermuten, dass DeepSeek ein Verfahren namens Model-Distillation verwendet hat. Dabei wird das Wissen eines großen Modells auf ein kleineres übertragen. Hinweise darauf sind, dass DeepSeeks Modelle mehrfach geantwortet haben sollen, dass sie ChatGPT seien. Auch andere Antworten deuteten darauf hin, wie etwa Informationen zur Beschränkung des Wissens.

DeepSeeks Modelle haben auch eigene Beschränkungen, die den Vorgaben der chinesischen Regierung entsprechen. Fragen zu Themen wie den Ereignissen auf dem Tian’anmen-Platz werden nicht beantwortet. 1989 wurden dort Proteste einer Demokratiebewegung gewaltsam beendet.

Exit mobile version