banner

Kategorie: Splitblog

Unser Splitblog im April – P versus NP

Wie erklärt man Außenstehenden eine Thematik, die der eigene Verstand kaum erfassen kann? Vor diese Herausforderung wurde unser Redaktionsteam diesen Monat gestellt. Wir wagen den Versuch und hoffen, es ist uns gelungen. Vielen Dank an unseren Entwickler Max, der unseren Horizont mit dem Themenvorschlag „Das P versus NP Problem“ erweitert Bevor wir zu diesem speziellen Thema vordringen, wollen wir zunächst einmal den Begriff „Millenniumproblem“ näher beleuchten. Als Millenniumproblem werden aktuell sieben im Jahre 2000 vom Clay Mathematics Institute (CMI) in Camebridge aufgelistete ungelöste Probleme der Mathematik bezeichnet. Für die Lösung eines dieser Probleme hat das Institut ein Preisgeld von jeweils einer Million US-Dollar unter der Bedingung ihrer Veröffentlichung in einer Fachzeitschrift versprochen. Die Liste umfasst diese Probleme: Nur eines dieser Probleme, nämlich der Beweis der Poincaré-Vermutung on der Topologie konnte bisher gelöst werden. Der russische Mathematiker Grigori Jakowletisch Perelman konnte im Jahre 2002 beweisen, dass die Vermutung zutrifft. Nachdem drei Teams die Lösung erfolgreich überprüft haben, sollte Perelman im Jahre 2010 das versprochene Preisgeld zugesprochen werden, obwohl er die Lösung lediglich im Internet publiziert hatte. Perelman lehnte das Geld und die damit verbundene Auszeichnung jedoch ab. Schauen wir uns nun das seit Jahrzehnten ungelöste P versus NP Problem in der Informatik genauer an. Es handelt sich hierbei um ein sogenanntes Entscheidungsproblem. Die Frage, die sich stellt, ist, ob die Klasse der Probleme, die mit einem relativ geringen Aufwand („polynomial time“) algorithmisch gelöst werden können (die Klasse P), mit der Klasse der Probleme gleichzusetzen ist, die zwar nicht unbedingt mit geringem Aufwand, aber zumindest mit einem vernünftigen Aufwand („nicht-deterministisch polynomiell“) überprüft werden können (die Klasse NP). Um das Problem zu veranschaulichen, kann man sich zum Beispiel die sogenannten „Knapsack-Probleme“ in der Informatik vor Augen führen. Stellen Sie sich vor, Sie planen eine Wanderung und müssen Ihren Rucksack packen. Die Frage lautet: Welche Gegenstände passen in den Rucksack und wie viel Gewicht können Sie noch einpacken? Diese Frage können Sie leicht beantworten, indem Sie einfach den Rucksack packen und die Gesamtmenge an Gewicht überprüfen. Die eigentliche Herausforderung besteht jedoch darin, vorherzusagen, welche Gegenstände Sie wählen sollten, um das optimale Gewicht zu erzielen. Das ist ein typisches NP-Problem. Die Frage, die das Millennium-Problem P versus NP stellt, ist also: Kann ein Computer ein NP-Problem schnell und effizient lösen, oder sind diese Probleme grundsätzlich zeitaufwändiger, selbst für einen leistungsstarken Computer? Die Beantwortung dieser Frage könnte die Welt der Computertechnologie revolutionieren. Wenn sich herausstellt, dass P gleich NP ist, wäre dies ein Durchbruch bei der Lösung vieler schwieriger Probleme, einschließlich der Optimierung des Maschinellen Lernens und der Kryptographie. Es würde sogar bedeuten, dass die Geheimnisse von Wissenschaft und Technologie wie nie zuvor entschlüsselt und unsere Welt durch die Rechenleistung von Computern verbessert werden könnte. Andererseits würde die Beantwortung der Frage, dass P nicht gleich NP ist, bedeuten, dass es eine fundamentale Grenze für die Computerwelt gibt. Einige Probleme sind einfach zu komplex für einen Computer, um sie schnell und effizient zu lösen. Das ist der Grund, warum das Millennium-Problem P versus NP so bedeutend und interessant ist. Es ist eine Herausforderung, die die Grenzen der Mathematik und Informatik auf die Probe stellt und uns dabei hilft, unser Wissen zu erweitern und unsere Welt durch die unglaubliche Leistungsfähigkeit von Computern zu verbessern. Wie wir alle wissen, erobern aktuell die unterschiedlichsten KI-Systeme den Markt. Insbesondere im Hinblick auf das beschriebene Problem, könnte KI der Schlüssel sein. Vielleicht wird es einer KI-Software gelingen, die Annahme P gleich NP zu beweisen. Oder eines der kommenden KI-Modelle selbst, könnte der Beweis dafür sein, dass ein NP Problem durch einen leistungsfähigen Computer genauso schnell und effizient gelöst werden kann, wie ein P Problem.

Unser Splitblog im März – Deep Mind Gemini 1.5

Heute wollen wir uns mit dem neuen KI-Model aus dem Hause Google beschäftigen. Hierbei handelt es sich um ein multimodales KI-Model, das verschiedene Arten von Informationen, wie zum Beispiel Texte, Bilder, Programmcodes und Audioinformationen und deren Kombinationen verarbeiten kann. Ein Themenvorschlag unseres Entwicklers Mats, der federführend für die Entwicklung unseres Chatbots Kosmo verantwortlich ist Vor wenigen Wochen stellte Google DeepMind Gemini 1.5 vor – ein Update der bisherigen KI-Modelle aus dem Hause Google. Bahnbrechend ist besonders die Datenmenge, die Gemini 1.5 verarbeiten kann. Bis zu 1 Million Token können im Kontextfenster bereitgestellt werden. In internen Experimenten konnte die Datenmenge sogar auf 10 Millionen Token erhöht werden. Ein Token ist eine Art Basiseinheit, mit der beispielsweise Sätze in kleinere Einheiten (Tokens) aufgeteilt und so von dem Modell verarbeitet werden können. Es handelt sich bei einem Token also um eine Gruppe von Zeichen. Zum Vergleich: Chat GPT-4 Turbo kann 128000 Tokens verarbeiten (Stand Dezember 2023). Das entspricht in etwa einem 300 seitigem Buch. Würden mehr Seiten bereitgestellt, könnte das Modell auf die Informationen der ersten Seiten nicht mehr zugreifen. Bildlich gesprochen wüsste es am Ende eines Buches nicht mehr, wie dessen Autor heißt. Gemini 1.5 kann bis zu einer Stunde Videomaterial, elf Stunden Audioaufnahmen, Texte mit bis zu 700000 Wörtern oder 30000 Zeilen Code erfassen und analysieren. Und, was noch erstaunlicher ist: es kann sich an die Inhalte „erinnern“ und diese mit neuen Informationen in Verbindung bringen. Bei der Vorstellung des neuen Modells wurden Gemini 1.5 mit der Aufgabe betreut, das 402 Seiten lange Transkript der Apollo 11 Mission zu analysieren und darin drei humoristische Stellen zu finden. Tatsächlich gelang es dem Modell, innerhalb von etwa 30 Sekunden, drei unterhaltsame Momente herauszufinden. So sagte Command Module Pilot Michael Colins beispielsweise an einer Stelle: „Der Zar putzt gerade seine Zähne, also springe ich für ihn ein.“. Ohne weitere Informationen luden die Forscher anschließend eine handgefertigte Zeichnung eines austretenden Stiefels hoch und fragten, welcher Moment auf dem Bild gezeigt wird. Die Antwort kam prompt: „Ein kleiner Schritt für einen Menschen, aber ein großer Schritt für die Menschheit.“ Gemini 1.5 kann also ohne konkrete Anweisungen komplexe Zusammenhänge herstellen und korrekt wiedergeben. Dieses Vorgehen erhöht die Effizienz und die Qualität der gelieferten Ergebnisse enorm. Aktuell ist Gemini 1.5 nur für ausgewählte Unternehmenskunden und Entwickelnde verfügbar. Wir sind gespannt auf die weitere Entwicklung.

26. Februar 2024 Carolina Keine Kommentare

Unser Splitblog im Februar – KI als Kontrahent in Videospielen

Wie füllt man einen Blog aus der Welt der KI mit spannenden und interessanten Inhalten? So viele Themen wurden in den letzten Monaten von so vielen Menschen ausführlich erörtert. Was können wir dem noch für neue Aspekte hinzufügen? Diese Fragen haben wir uns heute im Team gestellt und mal wieder hat sich gezeigt, dass die spontanen Einfälle oft die besten sind. Eine neue Blog-Rubrik, der „Splitblog“ ist geboren. Jeden Monat darf sich ab sofort ein Teammitglied ein Thema aus dem KI Umfeld wünschen, das in dieser Kategorie beleuchtet wird. Los geht es mit unserem Backendentwickler Florian und dem Thema „KI als Kontrahent in Videospielen“ Ein kurzer Blick in die Videospiele der letzten Jahre zeigt, dass sich die meisten Verbesserungen größtenteils auf die Grafiken bezogen. Immer mehr Details, immer größere Welten, immer bessere Auflösung. Die Grafik ist in vielen Spielen inzwischen so ausgereift, dass sie kaum mehr von der Realität zu unterscheiden ist. Doch wie sieht es mit dem Verhalten der verschiedenen Charaktere aus? Insbesondere was die Programmierung der NPCs angeht, liegt die Vermutung nahe, dass hier schon seit langem künstliche Intelligenz zum Einsatz kommt. NPCs sind die nicht spielbaren Charaktere eines Videospiels, wie beispielsweise Passanten, Verkehrsteilnehmende oder auch Spielgegner und -gegnerinnen. Mit ihnen kann in vielen Spielen bereits interagiert und kommuniziert werden und ihr Verhalten ist augenscheinlich oft unvorhersehbar. Doch was von außen wie künstliche Intelligenz wirkt, ist in Wirklichkeit die Leistung der Spieleentwickelnden. Statt künstlicher Intelligenz kommt in Videospielen häufig das so genannte „Pathfinding“ zum Einsatz. Das bedeutet, dass die Wege und Aktionen der NPCs bei der Entwicklung des Spieles festgelegt wurden. Die Optionen der NPCs sind in diesem Fall begrenzt und können von verschiedenen Faktoren, wie beispielsweise der Stärke des oder der Spielenden abhängen. Je mehr mögliche Optionen und Faktoren in der Entwicklung festgelegt wurden, umso realistischer erscheint das Verhalten der NPCs. Doch warum wird bei der Spieleentwicklung nicht auf KI gesetzt? Die Annahme liegt nahe, dass der Einsatz von künstlicher Intelligenz das Spielerlebnis verbessert. Das Verhalten der NPCs wäre situativer, individueller und weniger vorhersehbar. Auch die Kommunikation könnte noch sehr viel mehr auf die Spielenden angepasst werden. Was bei dieser vermeintlichen Verbesserung jedoch häufig außer Acht gelassen wird, ist, dass eine lernfähige KI schnell jeglichen Spielspaß zunichtemachen könnte. Die Wahrscheinlichkeit ist hoch, dass es für die Spielenden nahezu unmöglich wäre, gegen KI-gesteuerte NPCs zu gewinnen. Auch, weil sich die NPCs in Teams zusammenschließen könnten. Und noch ein weiterer Faktor wäre kaum zu beherrschen: NPCs, die auf KI basieren, wären beispielsweise in der Lage, Schauplätze zu verlassen und einfach „nicht mehr mitzuspielen“. Unter diesen Voraussetzungen ist Storytelling innerhalb eines Videospieles nicht umsetzbar. Vereinfacht kann man also sagen, dass der Einsatz künstlicher Intelligenz in Videospielen den Spielspaß negativ beeinflussen würde. Wer spielt schon gern ein Spiel, das man nicht gewinnen kann? Dennoch gibt es erste Spiele, bei denen künstliche Intelligenz zum Einsatz kommt. Noch sind bei diesen Spielen die Welten und Möglichkeiten begrenzt, aber das wird sich ändern. Entwicklungsteams ist es bereits gelungen, beispielsweise die Überlegenheit KI-gesteuerter NPCs zu begrenzen. Ein gutes Beispiel hierfür ist AlphaStar. Ein KI-basiertes Programm, das darauf trainiert wurde StarCraft II zu spielen. Hier ist es bereits gelungen, die KI in ihren Handlungen und Fähigkeiten zu drosseln, so dass AlphaStar (zumindest für absolute Spieleprofis) ein fairer Gegner bleibt. Wir dürfen gespannt sein, wie sich KI in den kommenden Jahren in Videospiele integrieren lässt.