Advancements in AI: New Tools and Features from Microsoft, Google, Amazon, and More

Microsoft hat neue KI-Agenten vorgestellt, die verschiedene Arbeitsaufgaben übernehmen können. Diese Agenten sind in Microsoft 365 und Dynamics 365 verfügbar und können im Copilot Studio ohne Programmierkenntnisse erstellt werden. Zu den neuen Agenten gehören Sharepoint-Agenten für Inhaltsverarbeitung, Self-Service Agents im BizChat für Mitarbeiterfragen, ein Moderatoren-Agent für effektivere Meetings und ein Projektmanager-Agent für Projektplanung. Hervorzuheben ist der Interpreter-Agent, der in neun Sprachen Echtzeitübersetzungen anbietet und sogar die Stimme des Nutzers verwenden kann. Eine zentrale Agenten-Bibliothek im Copilot Studio soll den Überblick bewahren.

Googles KI-Chatbot Gemini hat eine Erinnerungsfunktion bekommen. Diese Funktion ermöglicht es der KI, Daten und Vorlieben der Nutzer zu speichern, um personalisierte Antworten zu geben. Vor mehr als einem Jahr hatte Google angekündigt, dem damals noch Bard genannten KI-Chatbot eine solche Funktion zu geben. Bisher konnte sich Gemini keine Gesprächsinhalte merken, nur Informationen wie Sprache, Gerät und Standort. Das ändert sich nun, da Google der Konkurrenz nachzieht. Bereits Anfang des Jahres hatte OpenAI Memory für ChatGPT eingeführt. Gemini kann sich zum Beispiel daran erinnern, welche Vorlieben jemand beim Abendessen hat, sodass Antworten auf Restaurantempfehlungen auch Wochen später darauf zugeschnitten sein sollten. Nutzer können angeben, was sich der KI-Chatbot merken soll, zum Beispiel mit Phrasen wie “Vergiss nicht” oder “Nenne immer”. Die Funktion kann laut Google abgeschaltet und Erinnerungen einzeln gelöscht werden. Sie ist derzeit nur in englischer Sprache und im Browser verfügbar. Die mobilen Gemini-Apps haben noch kein Gedächtnis. Nur “Gemini Advanced” unterstützt diese Funktion, was ein “Google One AI Premium-Abo” erfordert.

Eine neue Forschungsmethode untersucht KI-Systeme in einem “Konzeptraum” und zeigt, dass sie über mehr Fähigkeiten verfügen als bisher durch einfache Prompts zugänglich war. Die Studie zeigt, wie Modelle Konzepte wie Farbe oder Form mit unterschiedlicher Geschwindigkeit lernen, abhängig von der Signalstärke in den Trainingsdaten. Forscher entdeckten, dass KI-Modelle durch Techniken wie “latente Interventionen” oder “Overprompting” versteckte Fähigkeiten aktivieren können, die mit normalen Prompts nicht abrufbar sind. Diese Erkenntnisse wurden an synthetischen Daten und realen Datensätzen wie CelebA und Stable Diffusion 1.4 bestätigt, wo die Modelle ungewöhnliche Bildkombinationen erzeugen konnten, die sie mit normalen Prompts nicht produzieren würden.

Das KI-Musik-Start-up Suno hat die Version 4 seines KI-Musikgenerators veröffentlicht. Das Update bringt Verbesserungen bei Audioqualität, Songtexten und Songstrukturen. Zu den neuen Funktionen gehören ein “Remaster”-Tool zur Aufwertung älterer Songs, der Lyrics-Assistent “ReMi” zur Unterstützung beim Texten sowie kreativere Cover-Art-Designs. Bestehende Funktionen wie “Covers” zum Neuinterpretieren eigener Audiodateien und “Personas” zum Speichern von Stilen wurden aktualisiert. Die ersten Nutzer-Reaktionen sind gemischt: Klarere Songtexte werden gelobt, technische Probleme mit Becken/Hall sowie Schwächen bei “Remaster” und “Personas” kritisiert. Insgesamt zeigt die Beta noch einige Kinderkrankheiten.

Die KI-Organisation LAION hat mit DISCO-12M den bislang größten öffentlich verfügbaren Musikdatensatz für das Training von Audio-KI-Modellen veröffentlicht. Er enthält 12 Millionen Links zu YouTube-Musikstücken mit zugehörigen Metadaten. Der Satz bietet eine verbesserte Datenqualität durch die direkte Erfassung von YouTube Music ohne Umweg über Spotify. Auch die Anzahl der erfassten Künstler wurde auf über 250.000 erhöht. LAION setzt sich für offene KI-Entwicklung ein, steht aber auch in der Kritik, da seine Datensätze teils auf geschütztes Material verweisen. Der neue Datensatz ist nur für akademische Forschung bestimmt, von kommerzieller Nutzung wird abgeraten.

Chinesische Forscher haben einen Roboter entwickelt, der Pflanzen durch Berührung ihrer Blätter identifizieren kann. Mit einer speziellen Elektrode misst der Roboter Eigenschaften wie gespeicherte Ladung, elektrische Leitfähigkeit und Kontaktkraft. Die gesammelten Daten werden mittels KI ausgewertet, wodurch der Roboter zehn verschiedene Pflanzenarten mit einer Genauigkeit von 97,7 Prozent erkennen kann. Das System soll in der Landwirtschaft zum Einsatz kommen, um Wachstum zu überwachen und Entscheidungen über Bewässerung und Düngung zu treffen. Im Vergleich zu visuellen Erkennungssystemen bietet diese Methode den Vorteil, weniger anfällig für Umwelteinflüsse wie Lichtverhältnisse oder Wetter zu sein. Die Forscher arbeiten an Verbesserungen, um mehr Pflanzenarten erkennen zu können und Echtzeitdaten zu liefern.

Amazon hat den KI-basierten Shopping-Assistenten “Rufus” eingeführt. Kunden in Deutschland und Österreich können Rufus über ein Icon in der Amazon-Shopping-App aufrufen. In einem Textchat kann man Rufus Fragen zu Produkten stellen, die über die technischen Daten hinausgehen. Diese Fragen können sich beispielsweise auf Informationen beziehen, die in der Bedienungsanleitung zum Produkt zu finden sind. Auch für Vergleiche zwischen verschiedenen Produkten soll Rufus genutzt werden können. Amazon erklärt, dass die Technologie noch in den Kinderschuhen stecke. Man wolle die KI-Modelle aber immer weiter verbessern und die Antworten kontinuierlich optimieren, sodass Rufus mit der Zeit immer hilfreicher werde.

Google hat ein Tool veröffentlicht, das Menschen beim Offline-Shopping unterstützen soll: das neueste Update für das KI-Bilderkennungstool Google Lens. Android- und iOS-Nutzer in den USA können in teilnehmenden Läden ein Foto eines Produkts mit der Google-App aufnehmen. Google Lens soll daraufhin detaillierte Produktinformationen, Kundenrezensionen, Preisvergleiche mit anderen Anbietern und ähnliche Produkte auflisten. Die Einkaufshilfe stützt sich auf Google Gemini und den Google Shopping Graph, der über 45 Milliarden Produkte listet. Unter den teilnehmenden Geschäften sind Macy’s, Target und Walmart. Nutzen soll man das Feature vorerst für Kosmetik, Elektronikartikel und Spielzeug – passend zum Weihnachtseinkauf.