Apples M4-Prozessor: Intel und Microsoft schlagen zurück!
Prozessoren wurden endlich wieder richtig spannend, insbesondere durch Apple. Noch bevor alle M3-Modelle das Tageslicht erblickt haben (es fehlt noch die Ultra-Variante), soll schon der M4 als Nachfolger mit seinen digitalen Hufen scharren. Dies könnte in Zusammenhang stehen mit dem (berechtigten) Hype um Künstliche Intelligenz. Dafür werden sehr schnelle Prozessoren benötigt. Den Hype nutzen offenbar auch Microsoft und Intel, um eine neue PC-Generation einzuläuten: Der »AI PC« soll speziell für diese Aufgaben ausgerüstet sein. Man darf sich auf riesige Werbefeldzüge freuen: Intel inside! Wie wird Apple darauf reagieren? Mit einer verbesserten Neural-Engine und der Möglichkeit von bis zu 512 GB RAM könnte der M4-Prozessor neue Maßstäbe setzen. (Spielzeit: 46 Minuten.)
Eine KI lieferte sich einen Luftkampf mit einem menschlichen Piloten und einem F16-Kampfjet. Die Herausforderung bestand nicht nur darin, das Flugzeug sicher durch komplexe Manöver zu steuern und dabei auch taktische Tricks zu befolgen; sondern auch darin, die Sicherheitsvorschriften für solche Trainingsluftkämpfe einzuhalten. Das berichtet die »Edwards Air Force Base« über ein aktuelles Projekt. Weiterlesen »
Besonders hervorgehoben wurde die schnelle Entwicklungszeit. In weniger als einem Jahr gelang der Schritt von der ersten Installation bis zur Demonstration der ersten KI-vs.-Mensch-Luftkämpfe.
Traditionelle Autonomie in der Luftfahrt existiert zwar schon seit Jahrzehnten. Aber maschinelles Lernen wurde aufgrund hohen Risikos und fehlender unabhängiger Kontrolle bisher ausgeschlossen. Die Herausforderung bestand darin, Vertrauen in die KI-Systeme aufzubauen, um sie realweltlich einzusetzen. Die Testpiloten, die zusätzlich zur KI im Cockpit anwesend waren, mussten zu keinem Zeitpunkt während der Luftkämpfe den Sicherheitsschalter betätigen. Dies stärkt das Vertrauen in die Fähigkeit der KI, komplexe Situationen zu handhaben.
GPT-4 zeigt beeindruckende Fähigkeiten in der Augenheilkunde und steht kurz davor, die Leistungen erfahrener Fachärzte zu erreichen. Das schreibt die Financial Times über ein kürzlich veröffentlichtes Forschungsprojekt. Die KI konnte in der Beurteilung von Augenerkrankungen und der Empfehlung von Behandlungen gleiche oder bessere Ergebnisse erzielen als fast alle spezialisierten Mediziner. Diese Forschungsergebnisse verdeutlichen das immense Potenzial der künstlichen Intelligenz in der medizinischen Diagnostik. Weiterlesen »
Warum ist das interessant?
Die Diagnose (die Erkennung) von Augenproblemen ist hochspezialisiert und erfordert umfangreiches Fachwissen, das traditionell nur durch langjährige Ausbildung und Erfahrung erworben wird. Der Zugang zu hochqualifizierten Augenärzten ist jedoch begrenzt, was zu Verzögerungen in der Behandlung führt und die Qualität der Patientenversorgung beeinträchtigen kann. Das gilt ganz besonders für ärmere Teile der Welt oder für ländliche Regionen, die über ein weniger dichtes Netz an Fachärzten verfügen.
Was wurde getestet?
87 Krankheitsbilder (sog. »Patientenszenarien«) wurden Ärzten in verschiedenen Ausbildungsstufen gezeigt, beispielsweise jungen Ärzte in der Ausbildung und auch erfahrenen Fachärzten. Man wollte herausfinden, wie gut die jeweilige Gruppe abschnitt, d.h. zu welchen Prozentsatz die Gruppe eine richtige Diagnose stellt. Das wurde mit den Ergebnissen der KI verglichen. Eine Besonderheit der Studie lag offenbar darin, die KI nicht mit »perfektem Bücherwissen« zu vergleichen, sondern mit den Antworten, die real praktizierende Ärzte tatsächlich gaben. Denn auch Ärzte liegen manchmal daneben, vielleicht verstärkt in kniffligen oder seltenen Fällen.
Es zeigte sich, dass GPT-4 in der Lage ist, Junior-Ärzte zu übertreffen und ähnliche Ergebnisse wie viele Fachärzte zu erzielen. Neu ist, dass die modernen KI-Systeme sehr breite Kenntnisse haben und damit auch komplexere Aufgaben bewältigen können, die es erfordern, Schlüsse zu ziehen. Diese neue Fähigkeit war es, die den Fortschritt gegenüber früheren KI-Systemen brachte.
Wie geht es weiter?
Die KI-Systeme, wie hier GPT-4, sind noch nicht ausreichend mit spezialisierten Daten trainiert. Durch spezialisiertes Training in bestimmten Wissensgebieten lässt sich die Qualität der Ergebnisse deutlich verbessern. Das Training kann erfolgen durch mehr »gute« Daten (die von Experten als korrekt eingestuft wurden), sowie durch eine Anleitung durch echte Ärzte. Der KI wird dabei mitgeteilt: »Das wäre die richtige Antwort gewesen«; oder: »Auf einen solchen Sachverhalt reagiert man so und so«.
Wichtige Punkte
Die Studie vergleicht die Fähigkeiten des KI-Modells direkt mit denen praktizierender Ärzte
GPT-4 erreicht oder übertrifft die Leistungen fast aller Fachärzte
KI zeigt Potenzial für komplexere diagnostische Aufgaben
Möglichkeit der weiteren Verfeinerung durch Training mit erweiterten Datensätzen
Fazit
Die Testergebnisse von GPT-4 in der Augenheilkunde sind ein bedeutender Fortschritt, der das Potenzial hat, die medizinische Diagnostik zu revolutionieren. Es geht nicht darum, Ärzte zu ersetzen, sondern darum, vor einer Behandlung zunächst eine erste (und möglichst korrekte) Diagnose zu erhalten. Eingesetzt werden könnte eine KI beispielsweise von allgemein ausgebildeten Ärzten (dem klassischen »Hausarzt«), der entscheiden muss, ob eine Überweisung an einen Facharzt sinnvoll ist. Auch in ärmeren Ländern, in denen einen erste Diagnostik vielleicht von Krankenschwestern vorgenommen wird, die nicht über die nötigen Kenntnisse verfügen können, wäre es eine Hilfe.
Die Tatsache, dass dieses KI-Modell mittlerweile leistungsfähig genug ist, um mit Experten auf ihrem Gebiet zu konkurrieren, darf man zwar nicht überbewerten. Es ist aber ein weiterer Meilenstein auf einem langem Weg und eine erstaunliche Technik.
Die neueste Beta von iOS macht es wahr: Das Laden von Apps über Webseiten, ohne jeglichen AppStore. Die EU hatte erzwungen, dass es auch »alternative« Möglichkeiten jenseits des AppStores geben muss. Dennoch möchte Apple den Schutz der Anwender (und damit auch den guten Ruf der iOS-Plattform) weiterhin gewährleisten. Weiterlesen »
So soll es in Zukunft funktionieren
Entwickler, die ihre iOS Apps über ihre Webseiten in der Europäischen Union anbieten möchten, müssen bestimmte Kriterien erfüllen, um die Sicherheit der iPhone-Nutzer zu sichern. Dazu gehört der Prozess der Notarisierung durch Apple, bei dem Apps durch Apple geprüft und für sicher befunden werden müssen. Zusätzlich müssen die Entwickler mindestens zwei Jahre Mitglied im Apple Developer Program sein. Nur Apps, die in der EU im vorangegangenen Jahr eine Million Erstinstallationen oder mehr verzeichnet haben, sind berechtigt, über eine Webseite heruntergeladen zu werden. Entwickler, die diese Bedingungen erfüllen, können dann eine API für den Web-basierten App-Download nutzen.
Apps, die über das Web heruntergeladen werden, können wie Standard-Apps gesichert, wiederhergestellt und aktualisiert werden. Um eine App von einer Webseite zu installieren, müssen iPhone-Nutzer in der EU ausdrücklich ihre Erlaubnis erteilen. Es kann sich also keine App »heimlich« auf dem Gerät installieren.
Entwickler dürfen nur eigene Apps anbieten (keine Apps von anderen Entwicklern) und müssen transparente Richtlinien zur Datensammlung veröffentlichen, damit die Nutzer informiert sind, wie ihre Daten gesammelt und verwendet werden.
Wichtige Punkte
Notarisierungsprozess durch Apple erforderlich
Mindestens zwei Jahre Mitgliedschaft im Apple Developer Program
Eine Million jährliche Erstinstallationen in der EU als Voraussetzung
API für Web-basierte Downloads
Benutzer müssen Installationen explizit erlauben
Transparente Richtlinien zur Datensammlung notwendig
Der »EU-Digital Markets Act«
Apples Entscheidung, Web-basierte App-Downloads in der EU zu ermöglichen, ist eine direkte Antwort auf den Digital Markets Act der Europäischen Union. Diese Regulierung verlangt von großen Technologieplattformen, offenere Ökosysteme zu schaffen, um Fairness und Innovation im digitalen Markt zu fördern. Obwohl Entwickler keine Verkaufsgebühren für über Webseiten vertriebene Apps an Apple zahlen müssen, wird von Apple eine technologische Grundgebühr von 0,50 Euro pro Jahr und Installation für Apps erhoben, die mehr als eine Million Installationen im vorherigen Jahr verzeichnet haben. Diese Gebühr wird jedoch für gemeinnützige Organisationen, akkreditierte Bildungseinrichtungen und Regierungseinrichtungen erlassen.
Die Möglichkeit, Apps außerhalb des App Stores herunterzuladen, ist ausschließlich auf iPhone-Nutzer in der Europäischen Union beschränkt und steht nicht für das iPad zur Verfügung.
Wichtige Punkte
Direkte Antwort auf den Digital Markets Act
Keine Verkaufsgebühren für Entwickler bei Web-Distribution
Technologische Grundgebühr von 0,50 Euro pro Installation. Gebühr wird erlassen für gemeinnützige Organisationen und Bildungseinrichtungen
Beschränkt auf iPhone-Nutzer in der EU
Kein iPad
Fazit
Die Einführung von Web-basierten App-Downloads in der EU kennzeichnet einen bedeutenden Wandel in der Art und Weise, wie Apps verteilt und genutzt werden. Apple reagiert mit dieser Neuerung auf den Digital Markets Act der EU und schafft ein offeneres Ökosystem, das die Sicherheit und Transparenz für Endbenutzer gewährleistet. Ob die Entwickler und EU-Kommissare mit Apples Hürden und Einschränkungen einverstanden sind, oder ob dagegen geklagt wird, dürfte sich noch zeigen.
Was ist besser: Mehr oder weniger? Das ist mehr oder weniger die Frage, vor der die Computerwelt gerade steht. Gleichzeitig ist es aber auch die Frage, jedenfalls mehr oder weniger, vor der die Computerwelt auch im Jahr 2007 stand, und vor der sie auch im Jahr 2027 stehen wird.
Drei Minuten bevor Steve Jobs das iPhone im Jahr 2007 vorstellte, war offensichtlich, dass mehr Buttons auf den damaligen Mobiltelefonen zu mehr Funktionen und zu einer besseren Bedienbarkeit führten. Es gab die zehn Ziffern, aber es gab auch praktische Tasten für weitere Funktionen, die man sich ansonsten mühsam in irgendwelchen Menüs hätte suchen müssen.
Drei Minuten nach der Präsentation von Steve war klar, dass plötzlich das Gegenteil galt: Das beste User-Interface ergab sich, wenn man auf Buttons möglichst verzichtete. Apple entschied sich für einen einzigen zentralen Button auf der Vorderseite des Geräts. Es war gleichzeitig einfacher und leistungsfähiger. Weiterlesen »
Zehn Jahre später, mit dem iPhone X, entfernte Apple auch noch diesen einsamen Button von der Vorderseite. Anstatt also von Modell zu Modell hier und da etwas anzustückeln, hielt Apple unerbittlich an seiner ursprünglichen Vision fest und brachte sie nur noch mehr zum glänzen.
Mehr oder weniger. Denn abgesehen von den Buttons hat Apple sehr viel hinzugefügt. Nicht nur die Hardware wurde enorm erweitert (mehr Speicher, mehr Pixel, mehr GigaHertz und GigaFlops), sondern auch die Software: Verschiedene »Ebenen« lassen sich über das Display legen und wieder ausblenden (Control Center, Notifications), verschiedene »Screens« wechseln sich ab (Lock Screen, Home Screen, App Switcher) — und die vielen Einstellungen scrollen, hübsch untereinander angeordnet, ungefähr bis nach Düsseldorf. (Wenn man in Dortmund anfängt.)
Die Frage nach dem nächsten iPhone und dem nächsten iOS lautet ganz simpel: Was kann man noch hinzufügen? Wird es ausreichend viel sein?
Falls nicht, falls es zu wenig ist, werden die kleinen Thumbnails bei YouTube mit traurigen Augen und runtergezogenen Mundwinkeln verkünden, dass man sich das Video am besten nicht anschauen sollte, außer vielleicht, um persönlich Zeuge zu werden von Apples Dummheit.
Hier ist mehr also besser.
Ich persönlich finde, hier wäre weniger besser, aber ich bin bei Social Media ein Außenseiter, was ich gerne akzeptiere.
Google
Schauen wir zu Google. Google präsentiert seinen Kunden seit Jahrzehnten nichts weiter als zehn blaue Links. Diese zehn blauen Links könnten tatsächlich das sein, wonach man gesucht hatte. Vielleicht aber auch nicht.
Wie kann man das verbessern? Wäre es besser, mehr zu zeigen? Etwa zwanzig blaue Links? Oder müssten es weniger sein, etwa fünf?
Google verfolgt sein ein paar Jahren ein Projekt, das dem Home-Button des iPhones entspricht: Das Beste wäre, wenn man überhaupt keine blauen Links zeigen müsste, und wenn der Kunde überhaupt keine Auswahl treffen müsste. Sondern Google sollte eine einzige definitiv richtige Antwort ausgeben.
Dieses Projekt (»One True Answer«) ist die Voraussetzung dafür, dass der Siri-Klon von Google kurze, zutreffende Antworten geben kann. In letzter Zeit sieht man die Antwort auch ganz oben auf der Webseite von Google. Es handelt sich dabei nicht nur um kurze Daten wie z.B. das Wetter. Sondern es sind aus Webseiten extrahierte Antworten auf komplexe Fragen, wie zum Beispiel: »Wie entstanden die ersten Helium-Atome?« Google beschränkt sich dabei auf etabliertes Fakten-Wissen, bei dem es zu einer klar definierten Frage eine klar definierte Antwort gibt.
Natürlich könnte man auch drei unterschiedliche Antworten mit leichten Variationen ausgeben, sodass der Kunde mehr Auswahl hat:
Wie viele Monster verstecken sich aktuell unter meinem Bett?
Keine.
Nicht viele.
Höchstens drei kleine.
Aber hier ist weniger eindeutig mehr.
Humane Ai-Pin
Über den missratenen Ai-Pin wurde viel berichtet, auch von Mac-TV. Aber die Aufregung über die schlecht funktionierende Umsetzung überstrahlte eine wichtige Frage, nämlich, wie man das Smartphone übertrumpfen könnte. Humane wählte dabei einen unglücklichen, miesepetrigen Ansatz, der das Smartphone schmähte, anstatt die Überlegenheit des eigenen Produkts zu beweisen.
Aber eines scheint mir einleuchtend zu sein: Wenn die grundlegende Idee eines Smartphone-Killers darin besteht, noch mehr Funktionen in ein winziges Gadget zu quetschen, dann kann es nur scheitern — genauso wie das iPhone gescheitert wäre, wenn es einfach die Buttons der damaligen Handys vermehrt hätte; oder wenn ein Google-Konkurrent doppelt so viele blaue Links zeigen würde.
Immerhin. Der Ai-Pin gibt einem auf die Frage, ob ein Restaurant gut oder schlecht ist, eine klare Antwort: Ja oder nein, oder ein Rating von 4 Sternen. — Wenn ich frage, ob der Supermarkt noch geöffnet hat, dann antwortet es (ebenso wie Siri): Ja, heute bis 21 Uhr. — Wenn ich Herrn Müller anrufen möchte, dann ruft es Herrn Müller an (ebenso wie Siri, genauer gesagt, Siri ruft gerne auch eine Person mit einem ähnlichen Namen an oder startet eine Playlist).
Ist das vielleicht ein genereller Trend, dass wir in Zukunft nicht nur sehr viele Optionen zur Verfügung haben wollen, dass wir aber überfordert sind, die richtige davon auszuwählen — sodass wir froh sind, wenn uns jemand die Entscheidung abnimmt? Ist das vielleicht ein neuer Steve-Jobs-Moment, bei dem jemand die ganzen Buttons entfernt, ohne die Funktionen zu entfernen?
Vision Pro
Apples Superbrille weist in die gegenteilige Richtung. Alles ist mehr, mehr, mehr, mehr, mehr, ein technischer Wahnsinn in jeder nur denkbaren Richtung. Eine technische Glanzleitung, die alles abverlangt, was Prozessoren, Displays und Software heute leisten können. Auch dem Anwender wird einiges abverlangt: hoher Preis, unbequeme Nutzung, Druckstellen, Hitze, zerwühlte Frisuren, Isolation.
Dafür bekommt man 3D statt 2D, das ist mehr. Dafür bekommt man 4k statt 2k, das ist mehr. Fotos werden zur »Experience«, der Desktop-Hintergrund wird zur virtuellen Umgebung, gerne mit einer Mondlandschaft. Mit Sound, das ist mehr. Das Musikvideo wird zum atemberaubenden Erlebnis, ein Schmetterling setzt sich einem buchstäblich auf den Finger (oder was man der Brille stattdessen hinhält, ich habe schreckliche Dinge gesehen).
Man kann Fenster nicht nur vorne anordnen, sondern auch seitlich, oben und unten. Das ist mehr. Sogar hinten. Das ist noch mehr.
Man kann iPad-Apps starten, aber auch native Apps und den kompletten Mac-Desktop. Das ist mehr.
Man könnte eine Tabellenkalkulation so breit ziehen, dass die Spalten bis hinaus auf den Flur reichen. Oder bis runter auf die Straße, bis zum nächsten Supermarkt; und, falls der geöffnet hat, auch bis zur Kasse. Spalten, Spalten, Spalten, mehr, mehr, mehr. Theoretisch könnte man an den Spalten vorbei spazieren wie vor einer Häuserwand; aber nicht nur alleine, sondern mit fünf weiteren virtuellen Teilnehmern, denn das ist noch mehr.
Was die Leute aber mit so vielen Spalten überhaupt anfangen sollen, bleibt unklar. Vielleicht möchten sie einfach fragen: »Was zum Teufel bedeuten diese Spalten für den Erfolg meiner Werbekampagne? Welche Ausgaben haben sich gelohnt? Welche nicht?« — Die Idee, dass die App dann einfach fünfhundert weitere Spalten auswirft, ist absurd. Wir brauchen nicht Spalten, sondern Antworten.
Der Ai-Pin hat als Produkt und Smartphone-Alternative nicht die richtige Antwort gegeben, aber das Team stellte zumindest die richtige Frage. Apples fantastische Ingenieure haben die richtige Antwort gegeben, aber auf welche Frage?
Was ist nun das Next Big Thing? Ist es KI oder die Brille oder ein Pin? Eins scheint mir jedenfalls einleuchtend: Es muss zunächst wieder simpel anfangen. Es muss das, was heute kompliziert ist, einfach machen. Und es muss dennoch mehr können. Das macht es so schwierig. Aber genau das kann Apple besonders gut. Mehr oder weniger.
Viele Leute denken, die neuen KI-Systeme wären ein Ersatz für Google, quasi eine Frage-und-Antwort-Maschine. Der Unterschied zu Google ist jedoch, dass nicht einfach eine häufig genannte Antwort aus den Weiten des Webs gefischt wird. Sondern die neuen Systeme können eigene Schlüsse ziehen und auf diese Weise Antworten finden, die man mit einer Google-Suche nicht erhalten kann. Sie können auch herausfinden, worin überhaupt das Problem besteht.
Hier ein eindrucksvolles Beispiel:
Man stelle sich vor, ein Team in einem Büro oder in einer Arztpraxis müsste eine erkranktes Mitglied, Herrn Meier, ersetzen.
Herr Meier verfügt über die Fähigkeiten X und Y. Nur eine weitere Person im Team verfügt über X und Y, alle anderen beherrschen nur eine davon, entweder X oder Y. Deswegen ist der Ausfall von Herrn Meier nicht leicht zu ersetzen. Die Frage ist, wie der Dienstplan so geändert werden muss, dass beide Fähigkeiten an jedem Tag abgedeckt sind, und dass sich möglichst wenig ändert?
Was tun? Eine Google-Suche nützt hier überhaupt nichts. Man kann es sich wohl auf einem Blatt Papier austüfteln, aber das Beispiel habe ich nur deswegen so simpel gewählt, weil es sprachlich etwas mühsam zu beschreiben ist und ich mich kurz fassen muss. Es ist aber leicht einzusehen, dass es für Menschen enorm schwierig wird, sobald noch die Fähigkeiten A, B und C zu berücksichtigen wären, und sobald es 80 Mitarbeiter beträfe, und sobald weitere Bedingungen hinzu kämen, etwa der freie Nachmittag von Herrn Schulze oder ein gesetzliches Limit für Überstunden. Weiterlesen »
Der klassische Ansatz für die Lösung eines solchen Problems liegt darin, eine Software zu entwickeln. Der Programmierer würde irgendeinen Weg finden, um Personalpläne zu erzeugen; aber das ist nicht einfach. Schon die Erfassung der Daten in digitaler Form (Mitarbeiter, Fähigkeiten, bisheriger Dienstplan, wer fällt aus) wäre eine recht große Aufgabe für einen Programmierer. Vielleicht wird aber die Personalplanung einfach anhand einer Tafel an der Wand des Personalbüros vorgenommen, was sich vielleicht als viel praxistauglicher erwiesen hat als irgend ein digitaler Schnickschnack.
Mit der neuen KI kann man solche Probleme lösen, ohne eine Software zu schreiben. Die KI findet eigenständig einen Weg. Nichtmal die Eingabe der Daten benötigt ein festes Format, sondern die KI »versteht«, was man meint. Sie kann sich die Daten sogar aus einem Screenshot oder einer Fotografie besorgen, beispielsweise der Fotografie eines Dienstplans.
Hier ist ein Transkript, wie GPT-4-Turbo (die derzeit beste KI-Engine) das Problem löst. Zuerst meine Eingabe:
Löse das folgende Problem, bei dem Mitarbeiter mit ihren Fähigkeiten X und Y so im Wochenplan verteilt werden, dass jede Fähigkeit, X und Y, an jedem Tag zur Verfügung steht. Ein Mitarbeiter ist erkrankt und muss durch die anderen Mitarbeiter ersetzt werden. Ändere den Wochenplan so, dass sich möglichst wenig ändert und trotzdem alle Fähigkeiten an jedem Tag zur Verfügung stehen.
Gib den neuen Wochenplan so aus, dass neben dem Namen in Klammern angegeben wird, welche Aufgabe er abdeckt. Beispiel: Frau Heinrich (X).
Mitarbeiter, Fähigkeit:
Herr Müller, Y
Frau Schulze, Y
Frau Heinrich, X und Y
Herr Meier, X und Y
Frau Haller, X
Herr Mett, X
Wochenplan:
Montag: Frau Heinrich, Herr Müller
Dienstag: Herr Meier, Frau Schulze
Mittwoch: Frau Haller, Herr Müller
Donnerstag: Herr Mett, Herr Müller
Freitag: Frau Heinrich, Frau Schulze
Erkrankte Person: Herr Meier.
Die KI gab daraufhin folgende Antwort. Auch die Anmerkungen sind von der KI. Ich habe nichts hinzugefügt.
Um den Ausfall von Herrn Meier zu kompensieren, müssen wir jemanden finden, der sowohl Fähigkeit X als auch Y besitzt, da Herr Meier beide Fähigkeiten hat. Die einzige andere Person mit beiden Fähigkeiten ist Frau Heinrich. Wir müssen also den Wochenplan so anpassen, dass Frau Heinrich an einem Tag arbeitet, an dem Herr Meier ursprünglich eingeplant war, ohne dabei die Abdeckung der Fähigkeiten X und Y an den anderen Tagen zu beeinträchtigen.
Ursprünglicher Wochenplan:
- Montag: Frau Heinrich, Herr Müller
- Dienstag: Herr Meier, Frau Schulze
- Mittwoch: Frau Haller, Herr Müller
- Donnerstag: Herr Mett, Herr Müller
- Freitag: Frau Heinrich, Frau Schulze
Da Frau Heinrich bereits am Montag und Freitag arbeitet, können wir sie nicht für Dienstag einplanen, ohne einen anderen Tag zu beeinträchtigen. Wir müssen also jemand anderen finden, der am Dienstag arbeiten kann und zumindest eine der Fähigkeiten abdeckt, die Herr Meier hat. Da Frau Heinrich die einzige andere Person mit beiden Fähigkeiten ist und sie nicht verfügbar ist, müssen wir uns auf die Mitarbeiter konzentrieren, die entweder X oder Y haben.
Eine Möglichkeit besteht darin, einen Mitarbeiter mit Fähigkeit X für Dienstag einzuplanen, da Frau Schulze, die an diesem Tag arbeitet, bereits Fähigkeit Y abdeckt. Wir könnten also entweder Frau Haller oder Herrn Mett für Dienstag einplanen. Da Frau Haller bereits am Mittwoch arbeitet, wäre es sinnvoll, Herrn Mett für Dienstag einzuplanen, um die Änderungen im Wochenplan zu minimieren.
Neuer Wochenplan:
- Montag: Frau Heinrich (X und Y), Herr Müller (Y)
- Dienstag: Herr Mett (X), Frau Schulze (Y)
- Mittwoch: Frau Haller (X), Herr Müller (Y)
- Donnerstag: Herr Mett (X), Herr Müller (Y)
- Freitag: Frau Heinrich (X und Y), Frau Schulze (Y)
Mit dieser Anpassung stellen wir sicher, dass an jedem Tag beide Fähigkeiten, X und Y, abgedeckt sind, und minimieren gleichzeitig die Änderungen im Wochenplan.
Man kann an diesem Beispiel sehen, wie gut die KI die (übrigens auf deutsch geschriebene) Aufgabe verstanden hat. Sie gibt gleich im ersten Absatz eine Zusammenfassung des zu lösenden Problems. Anders als bei einer klassischen Software sind der KI auch die Zusammenhänge bekannt: Wochentage, Wochenarbeitszeit, Personen, übermäßige Arbeitszeiten. Eine Software mit solchen Kenntnissen zu füttern ist nicht gerade trivial. Bei der KI scheinen sie einfach vorhanden zu sein.
Anschließend beschreibt die KI ihre Lösungsschritte und worauf es dabei ankam. Sie wägt verschiedene Lösungsmöglichkeiten ab und zeigt Spielräume. Anschließend entscheidet sie sich für eine Lösung und gibt sie aus.
Was bedeutet das?
Erstens, es ist eine riesige Revolution. Zweitens, es wirft die Frage auf, welche Software überhaupt noch geschrieben werden muss. Ein Software-Entwickler würde wohl nicht mehr monatelang (mindestens!) an einer Lösung tüfteln, sondern würde die KI einfach zum Kern seiner Software machen und sich nur noch um das »Drumherum« kümmern. Beispielsweise ein Knopf, mit dem eine Person krankgemeldet werden kann, und dann spuckt die Software einen neuen Dienstplan aus, ohne dass man einer KI das Problem erst noch erklären müsste.
Das wiederum bedeutet: Wir stehen vor einem immensen Umbruch sowohl bei den Fähigkeiten von Software, als auch beim Tempo, mit der sie entwickelt wird.
Drittens, diese Revolution ist zur Abwechslung mal tatsächlich nützlich. Seit der mobilen Revolution mit dem Smartphone und schnellen Mobilfunknetzen ist nicht mehr viel passiert, abgesehen von schwachsinnigem Schwachsinn wie Facebook, Twitter, Instagram und TikTok. Und abgesehen von Werbetracking. Und abgesehen von Cookie-Warnungen. Und abgesehen von Newslettern, Spam und noch mehr Spam. Silicon Vally wirkte in den letzten zwanzig Jahren, als würde es geleitet von Fix & Foxi.
Viertens, es macht die Nutzung von IT-Intelligenz viel leichter erreichbar, sodass mehr Menschen davon profitieren können — wie das Beispiel mit der Arztpraxis gezeigt hat.
Das war die Idee des ersten Macintosh. Man muss nicht immer jedes technische Detail wissen und beherrschen, sondern man hat vielleicht eine gute Idee und möchte sich darauf konzentrieren. Die Software soll das ermöglichen. Sozusagen der Computer als das »Fahrrad für den menschlichen Geist«, so sah es der junge Steve Jobs.
Nächste Live-Sendung: Sonntag, 21. April um 19:00 Uhr
Sie sind neu hier? Herzlich willkommen! Unsere Live-Sendung findet normalerweise am Sonntag um 19 Uhr statt, aber natürlich gibt's auch mal Verschiebungen oder Sondersendungen. Unten sehen Sie die demnächst geplanten Sendungen.
Tipp: Abonnieren Sie unseren Kalender, um automatisch immer die aktuellen Termine in Ihrem Kalender angezeigt zu bekommen.
Falls Sie eine Live-Sendung verpasst haben, finden Sie die Aufzeichnung meist nach einem Tag in der rechten Spalte unter dem Titel "ReLive". Die ReLive-Sendungen enthalten zusätzlich zu den einzelnen Beiträgen immer noch einige kleinere Themen oder Schabernack.
Es gibt Neuigkeiten von der Vision Pro, die in Deutschland noch nicht verfügbar ist. Doch je näher wir an die WWDC heranrücken, desto wahrscheinlicher wird es, dass sie auch in weiteren Ländern erhältlich sein könnte. In den USA ist bereits die nächste Bewertungsrunde im Gange. Mit etwas mehr Zeit und Abstand gibt es mittlerweile interessante Einsichten über die Stärken und Schwächen des Geräts, vor allem aber über menschliche Eigenschaften, die dazu beitragen, dass man die Brille mehr oder weniger gerne trägt. Wir werden uns heute über die neuesten Entwicklungen informieren und auch einige der jüngsten Bewertungen aus der Blogosphäre zusammenstellen. Direkt zum Film »
Wir werfen einen Blick auf die ersten Berichte über den Humane AI Pin. Es soll uns vom Smartphone-Wahnsinn befreien und dennoch die wichtigsten Funktionen bieten: Kommunikation, Information und Unterhaltung — natürlich in Maßen. Weniger ist mehr, so ungefähr lautet die Idee. Zentrales Element ist dabei die Künstliche Intelligenz. Hingegen: Zentrales Element der Smartphone-Ära sind Apps. Es ist also ein ganz anderer Ansatz. Obwohl die ersten Testberichte nicht sonderlich positiv waren, ist das Konzept dennoch faszinierend. Denn ähnlich wie das Internet einst nur einem Computer im Haushalt vorbehalten war, könnten wir bald eine Vielzahl von intelligenten Geräten haben, die miteinander verbunden sind. Ist es ein zukunftsträchtiges Produkt? Direkt zum Film »
Man könnte annehmen, dass es unmöglich wäre, beide Fragen zu beantworten, bis Apple zur WWDC 2024 endlich den Vorhang beiseite zieht. Woher will man wissen, was eine unbekannte Software leisten wird?
Natürlich ist das spekulativ. Aber man kann Spielräume ausloten, die sich Apple demnächst bieten. Der Zweck des Artikels ist also nicht, definitive Behauptungen aufzustellen, sondern darzulegen, wie das Umfeld aussieht, in dem sich Apple bewegt. Weiterlesen »
Es bewegt sich
Zunächst: Bewegt sich Apple überhaupt? Die kurze Antwort ist: Ja, das wissen wir sicher. Die massiv skalierte KI, und dort ein ganz spezielles Phänomen namens MMLU, wird die gesamte Software-Industrie auf den Kopf stellen.
MMLU bedeutet: Massive Multitask Language Understanding. Damit ist die Fähigkeit gemeint, verschiedene Wissensbereiche (»Multitask«) so zu verstehen, dass es einem Expertenwissen entspricht. Gemessen wird es an komplexen Benchmarks, aber man kann es sich vereinfacht so vorstellen, dass man die KI mit den Fragen einer Examensprüfung in Jura, Medizin, Informatik oder anderen Wissensbereichen konfrontiert, und dann misst, wie viele Aufgaben korrekt gelöst wurden. Das Ergebnis wird dann in Prozent ausgedrückt, beispielsweise 87%.
Entscheidend ist dabei eine Sache, die in der Öffentlichkeit oft missverstanden wird: Es geht hier nicht um reines Wissen, also nicht um ein Nachplappern von Wikipedia-Artikeln. Sondern es geht bei MMLU darum, Schlüsse zu ziehen. Es geht um das Verständnis eines Sachverhalts oder eines Problems. Anschließend muss die KI ihr Wissen darauf anwenden, um zu einer Lösung zu gelangen. In der Öffentlichkeit werden die KI-Systeme oft gebraucht als ein bequemer Ersatz für Google, quasi als Suchmaschine für »die richtige Antwort«. Aber das ist nicht, was die neue KI so interessant macht.
Ein Beispiel: In der letzten Live-Sendung vom 7. April habe ich demonstriert, wie eine KI aus einem Artikel von MacRumors.com jene Abschnitte erkennt, die zu einer Kontroverse führen könnten. Das Ziel war, ein Sendekonzept für Mac-TV zu schreiben. Dazu muss man erkennen, worin die diskussionswürdigen Details bestehen. Die KI hat nicht nur die Kontroversen gefunden, sondern auch, welche Pro- und Contra-Argumente man dabei abwägen müsste.
Das beweist, das MMLU tatsächlich ein Verständnis für das jeweilige Thema entwickeln kann. Bei dem Demo handelte es sich nur um einen »Shortcut«, also um keine ausgefeilte Software. Aber man kann sich ausmalen, was größere Teams mit besseren Werkzeugen damit anstellen können (und werden).
Skalierung
Diese verblüffende Fähigkeit ergibt sich aus einer massiven Skalierung. Die KI-Modelle sind mittlerweile so gigantisch groß, dass man es sich kaum vorstellen kann. Das Demo mit dem Sendekonzept basiert auf GPT-4, was angeblich 1,8 Billionen (1800 Milliarden) Parameter so verschaltet und gewichtet, dass am Ende diese Fähigkeiten entstehen. Derzeit skizziert man schon Modelle, die auf 10 Billionen Parameter basieren — niemand weiß genau, welche Fähigkeiten dadurch möglich werden.
Man weiß aber sicher, dass die Fähigkeit, Schlüsse zu ziehen, mit der Größe der Modelle wächst. Hier ist eine Grafik, die das anschaulich macht:
Die Grafik zeigt die Namen verschiedener KI-Modelle. Der rote Pfeil weist die Richtung, in der man die Grafik lesen muss. Je weiter rechts sich eine KI befindet, desto besser schneidet sie bei den MMLU-Tests ab. Die besten Systeme liegen bei 85 Prozent. Das kostenlose ChatGPT 3.5, was derzeit die meisten Anwender benutzen dürften, liegt bei nur 65 Prozent.
In einer einzigen Generation gelang GPT ein Sprung von 65 auf 85 Prozent. Googles »Gemini« sprang von 70 auf 85 Prozent. Das sind Werte von Systemen, die 2023 entstanden. Was wird wohl im Jahr 2024 entstehen?
Je mehr Parameter die Modelle haben, desto schlauer werden sie offenbar. Ganze Rechenzentren müssen monatelang vor sich hin rechnen, um derart leistungsfähige KI-Gehirne zu erzeugen. Anschließend folgen noch weitere Stufen zum Training, die ungefähr ein halbes bis ganzes Jahr dauern. Eine neue Generation benötigt derzeit etwa ein Jahr an Rechenzeit und Training.
Merke: Die Leistung ist verbunden mit Skalierung; und die Skalierung ist verbunden mit Kosten.
Der Preis ist heiß
Es sind massive Investitionen, die vorab getätigt werden müssen, ehe man auch nur einen Cent verdienen könnte. Microsoft hat gerade beschlossen, ein Budget von 100 Milliarden Dollar bereitzustellen, um damit neue Rechenzentren zu bauen. Das sind selbst im Zeitalter von Cloud-Diensten völlig unbekannte Dimensionen. Auch für Apple sind das astronomische Zahlen.
Wir sind es gewohnt, dass fast alles, was mit dem Internet zu tun hat, kostenlos verteilt wird. Aber solche Beträge kann niemand einfach verschenken.
Oder vielleicht doch? Oder beinahe? Es gibt nämlich durchaus einen Markt für einfache und billige Systeme. Manche Aufgaben erfordern nicht viel Rechenzeit oder können sogar lokal auf dem Gerät berechnet werden. Für einfache Zwecke kann das reichen. Andererseits ist es für Apple immer verlockend, einen Premium-Preis für das beste Produkt zu verlangen. Und hier scheint die neue KI eine wahre Goldgrube zu sein. Denn die besten KI-System sind nicht etwa ein paar Prozent teurer. Sie kosten auch nicht das Doppelte. Sondern das Zehnfache.
Das Bild oben zeigt die Preise für KI-Systeme auf einer logarithmischen Skala, d.h. jeder Skalenstrich (von oben nach unten) bedeutet eine Verzehnfachung. Man kann daran ablesen, dass die besten Systeme mit 100 Dollar pro 1 Million »Tokens« abgerechnet werden. Es existiert ein mittleres Segment, zu dem auch ChatGPT 3.5 zählt. Es kostet 10 Dollar. Dann gibt es eine Reste-Rampe für 1 Dollar.
Das bedeutet: Die besten Anbieter können einen zehnfachen oder sogar hundertfachen Preis verlangen. Klingt das nach Apple?
Falls Apple tatsächlich zu den Besten gehören wird (irgendwann in der Zukunft), dann muss Apple gigantische Investitionen wettmachen. Die Gerüchte, Apple würde iOS 18 einfach so mit wunderlichen KI-Fähigkeiten ausstatten, sind sehr wahrscheinlich falsch. Richtig ist vermutlich, dass Apple recht niederwertige KI-Fähigkeiten einbauen wird, die in einem begrenzten Rahmen nützlich sein werden, beispielsweise begrenzt auf bestimmte Funktionen innerhalb einer App.
Bestimmte hochwertige Funktionen gibt es eben nur mit iCloud+ oder »iCloud AI«, weil hochwertige KI eine unglaubliche Rechenleistung erfordert, wie sie nur Rechenzentren bieten. Abgerechnet wird es per 100 Anfragen zu je 5 Dollar. Oder so ähnlich.
Apple hat im Prinzip zwei Möglichkeiten, um mit den Kunden ins Geschäft zu kommen. Entweder bieten sie das beste Produkt. Oder das bequemste: Wenn die Funktionen hübsch integriert sind in die Apps, die wir sowieso benutzen, und wenn wir dazu nur einen Schalter bewegen müssen, um mehr Leistung zu erhalten — dann werden viele Kunden bei Apple bleiben. Das ist das Prinzip von iCloud.
Auf der anderen Seite: Die besten und teuersten KI-Systeme sind derzeit zu Leistungen imstande, die absolut haarsträubend sind. Wer das gesehen hat und für sich nutzen kann, wird es haben wollen, egal von wem. In den letzten zwei Jahrzehnten waren wir es gewohnt, dass PC-Anwender zum Mac gewechselt sind. Der Trend könnte sich wieder umkehren. Der Unterschied zwischen den »mäßigen« und den »guten« KI-Systemen ist größer als das, was Apple mit der Eleganz ihrer Software wettmachen könnte. Manchmal zählt einfach die schiere Leistung.
Niemand weiß das besser als Apple. Warum? Weil Apple Tausende von Programmierern beschäftigt, die diese Revolution als erste spüren. KI-Systeme können einen Programmierer produktiver machen auf eine Weise, die einfach unglaublich ist. Ich sage voraus, dass es innerhalb eines Jahres keinen Programmierer mehr geben wird, der ohne einen KI-Assistenten arbeitet. Die ganze Branche wird innerhalb eines Jahres komplett umgekrempelt. In Apples Großraumbüros wird vermutlich über kaum etwas anderes geredet. Es ist absolut unmöglich, dass Tim Cook es überhört.
Was sagt uns das?
Apples zukünftige KI wird vermutlich sehr klug sein und irgendwann 90 Prozent eines MMLU-Benchmarks erreichen — weil es die besten Systeme heute schon können. Diese Klugheit wird einen Preis haben und nicht kostenlos in iOS oder macOS integriert sein. Die kostenlose Variante wird nur die Grundschule besucht haben. Aber für begrenzte Szenarien innerhalb von Apps wird sie nützlich sein.
Wir können eine weitere Vorhersage wagen: Das ganze Unterfangen ist riesig groß. Man muss sich ganz und gar darauf einlassen, oder man lässt es besser bleiben. Man kann nicht Milliarden ausgeben für eine unwichtige Funktion in irgendeiner App. Aber das ist der Preis, um überhaupt noch mitspielen zu können. Apple hat keine Wahl, als mit beiden Füßen auf den neuen Zug aufzuspringen. Entsprechend vielfältig werden Apples Versuche sein, seine Investitionen wieder reinzuholen.
Die Erwartungen an die WWDC 2024 sind hoch, besonders bezüglich iOS 18, das bereits als das umfangreichste Update in der Geschichte von Apple gehandelt wird. Anders als in den Vorjahren, wo lange Listen von Neuerungen oft wenig Überraschung boten, hält sich die Informationsflut diesmal in Grenzen. Dieses Mal steht insbesondere die Integration von Künstlicher Intelligenz im Fokus, ein Bereich, der das Potential hat, die Nutzung von Smartphones grundlegend zu verändern. Auch iMessage und Maps stehen auf der Liste der erwarteten Überarbeitungen, die signifikante Verbesserungen versprechen. Im Laufe unserer Sendung werden wir die kursierenden Gerüchte eingehend untersuchen und diskutieren, wie relevant und wahrscheinlich diese Veränderungen für die Nutzer sein könnten. Direkt zum Film »
Apple hat über die Jahre hinweg seine Fähigkeit unter Beweis gestellt, Geschäftsbereiche gezielt und klar zu strukturieren, wobei stets eine Konzentration auf das Wesentliche im Vordergrund stand. Die ursprüngliche Produktmatrix von Steve Jobs, die zwischen Consumer- und Pro-Produkten sowie Laptops und Desktops differenzierte, wurde mit der Zeit durch eine beeindruckende Produktvielfalt, insbesondere seit der Einführung des iPhones, erheblich erweitert. Eine Betrachtung der Entwicklungen über die letzten Jahrzehnte bietet spannende Einblicke: Welche Leitideen prägten die verschiedenen Phasen? Welche Innovationen gelten heute als überholt, welche sind noch immer bedeutend? Und vor allem: Welche Visionen treiben Apple heute an und führen in die Zukunft? Direkt zum Film »
Die M-Prozessoren bergen viele interessante Geheimnisse und Details. Besonders wichtig sind dabei die Performance-Cores und Efficiency-Cores, die sowohl für Leistung als auch Effizienz sorgen. Wir werden uns genauer ansehen, wie diese Cores in den Prozessoren zusammenarbeiten und welche Rolle sie spielen. Die Cores werden in sogenannte Cluster zusammengefasst. Dabei vergleichen wir die bisherigen Prozessor-Generationen, um herauszufinden, wie (und warum) sich Cluster-Zusammensetzung unterscheidet. Was bedeutet das für die Leistungsfähigkeit der aktuellen M3-Chip-Familie im Vergleich zum Vorgänger, dem M1-Chip? Achtung, Nerd-Alarm! Direkt zum Film »
Zwei Themen schafften es in unsere muntere Rundschau. Erstes Thema: Die Programmierung künstlicher Intelligenz mit Prompt Engineering, die Nutzung von Few-Shot-Examples, und all das verbunden mit dem Mac und mit Shortcuts. Klingt kompliziert! Aber es handelt sich um einfache und dennoch höchst wirksame Methoden, um einer KI beizubringen, was man haben möchte. Jörn wird zeigen, wie man auf dem Mac einen Text aus einem Video extrahiert und daraus einen Einleitungstext für eine Webseite bastelt. Automatisch und ohne weitere Software. — Zweites Thema: Der Browserkrieg ist wieder eröffnet! Microsoft zwängt sich frech zwischen Chrome und Anwender. Wir haben Beweise! Direkt zum Film »
Das obige Spiel wurde vollständig von einer künstlichen Intelligenz programmiert. Man kann den linken Puck mit der Maus nach oben/unten bewegen. Der rechte Puck wird von der KI gesteuert. Es hat mich nur wenige Minuten gekostet, das kleine Spiel zu erzeugen.
Ich habe die KI gebeten, Buttons zu erzeugen, mit denen die Anwender die Hintergrundfarbe der Webseite ändern können. Die KI hat das Problem in 10 Sekunden wie folgt gelöst:
Wann ist eine Computerfirma wichtig und mächtig? Liegt das an den Umsätzen? Nicht auf Dauer. Denn die Wichtigkeit und die Macht einer Computerplattform ergibt sich aus den APIs und deren Verwendung. Unter APIs versteht man Bausteine eines Betriebssystems, mit denen Software-Entwickler ihre Apps aufbauen können. APIs ermöglichen es Entwicklern, auf bereits vorhandene Funktionen zuzugreifen, ohne diese von Grund auf selbst entwickeln zu müssen. Weiterlesen »
Das hat drei wichtige Folgen: Erstens, eine leistungsfähige API kann eine ganze Plattform auf ein höheres Niveau heben, weil die Entwickler bereits von einem höheren Niveau starten können. Das hält die Plattform attraktiv und wettbewerbsfähig für die Anwender. Zweitens, eine leistungsfähige API bindet die Entwickler an die Plattform. Drittens, eben dies ist die Voraussetzung dafür, dass es überhaupt jemanden interessiert, wenn Apple zu einer WWDC einlädt, um die neuen Funktionen zu demonstrieren. Es ist also ein Kreislauf: Gute APIs sind die Voraussetzung für gute Apps, dies bindet die Kunden, dies bindet die Entwickler, und dies macht den Anbieter relevant, sodass er die APIs weiter ausbauen kann.
Wenn dieser Kreislauf ins Stocken gerät, verliert der Plattformbetreiber seinen Einfluss. Selbst wenn er gute Innovationen bieten würde, käme es nicht mehr im Markt an. Es ist daher unverzichtbar, dass ein Plattformbetreiber es erreicht, dass seine APIs benutzt werden.
Neue Spielregeln
Mit dem überfallartigen Erfolg von Künstlicher Intelligenz ändert sich das Spiel. Aktuell dominiert OpenAI das Feld der KI-Entwicklungswerkzeuge, unterstützt durch die Partnerschaft mit Microsoft. Ihr Erfolg liegt nicht nur in der Leistungsfähigkeit ihrer KI-Modelle, sondern auch in der Vielfältigkeit und Zugänglichkeit ihrer APIs. Diese Werkzeuge ermöglichen es Entwicklern, Anwendungen zu erschaffen, die weit über einfache Chatbots hinausgehen. Tatsächlich steht die KI-Technologie an der Schwelle, die nächste große Plattform zu werden, vergleichbar mit der Revolution durch das Smartphone und dessen App-Ökosystem.
In der allgemeinen Öffentlichkeit wird KI derzeit verbunden mit Quassel-Engines wie ChatGPT: Sie sind unterhaltsam, können Texte kürzen und eventuell als Ersatz für Google oder Wikipedia dienen. Aber sonst?
Tatsächlich ist das nur die Spitze des Eisbergs. ChatGPT ist lediglich eine Anwendung der neuen Technik. Das wahre Potenzial der KI liegt in ihrer Fähigkeit, die Grundlage für zukünftige Apps und Workflows zu bilden. Man kann damit programmieren, nur viel schneller; und man kann damit Lösungen erzeugen, die mit klassischer Programmierung völlig außer Reichweite sind.
Die neuen KI-Systeme sind also nur scheinbar eine »Anwendung«. Unter der Haube verbergen sich Plattformen. ChatGPT ist also weniger eine Konkurrenz zu einer herkömmlichen App (oder zu Siri), als vielmehr eine Konkurrenz zu einem Betriebssystem — in dem Sinne, dass darauf Apps und Lösungen aufgebaut werden.
Ist das gefährlich? Ja. Denn wenn ein Entwickler erhebliche Zeit aufwendet, um damit eine neue Lösung zu bauen, dann wird er nicht bei nächster Gelegenheit zurückkehren zu Apple, falls diese irgendwann ein ähnliches System anbieten. Sondern weg ist weg. Das trifft auf KI-Systeme noch stärker zu als auf klassische APIs, weil KI-Systeme zusätzlich trainiert werden müssen, um sie fit zu machen für bestimmte Anwendungen. Man kann es nicht ohne weiteres auf ein anderes System übertragen. Manchmal dauert es eine Weile, bis ein KI-System zuverlässig die richtigen Antworten gibt oder die richtigen Entscheidungen fällt.
Vermutlich hat Microsoft deswegen so hastig eine Partnerschaft mit OpenAI eingefädelt. Es ging wohl weniger um einen Chatbot innerhalb von Word. Sondern es ging um die APIs, mit denen sich Apps und Anwendungen bauen lassen. Microsoft hat verstanden, dass es sich um eine Plattform handelt. Es geht darum, Entwickler zu binden.
Ein Beispiel
Hier ist ein konkretes Beispiel, welche Art von App man per KI realisieren könnte — und wohlgemerkt, es geht darum, ob der Aufwand dafür so gering ist, dass es sich überhaupt lohnt:
Nehmen wir an, ich würde gerne eine App entwickeln, mit der man sich fit halten, ein paar Kilo abnehmen und etwas gesunder leben könnte. Die App würde Tipps geben, ein tägliches Training vorschlagen und Kochrezepte empfehlen. Es soll aber alles abhängig sein von den Daten des Anwenders. Die Daten wären also nicht fest vorgegeben.
Die Infos dazu (Trainingspläne, Kochrezepte, ein paar kluge Sprüche) hätte ich bereits in Form einiger Bücher. Vielleicht wäre ich selber ein Autor und würde nun das Wissen der Bücher in diese App übertragen wollen.
Das ist mit Apples herkömmlichen APIs eine sehr große Aufgabe. Aber eine KI würde sich die Infos aus den Büchern holen. Ich würde dann eine Reihe von Beispielen geben, wie die zu erwartenden Fragen der Anwender beantwortet werden sollten. Das muss keineswegs vollständig sein, sondern die KI soll nur Beispiele bekommen.
Wenn das Training der KI erledigt ist, sage ich der App genau, was sie tun soll: Jeden Tag eine motivierende Meldung ausgeben, den aktuellen Trainingsplan erläutern, nach dem heutigen Befinden fragen, drei Kochrezepte vorschlagen. Die KI findet selbstständig heraus, wie es diese Aufgaben löst. Es muss nicht programmiert werden. Das ist der Clou.
OpenAI und Microsoft bieten schon heute Werkzeuge an, mit denen sich eine solche App realisieren liesse. Die API ist noch nicht sehr umfangreich, aber man kann immerhin schon eine KI anhand eigener Daten (die man als Datei hochlädt) trainieren. Man kann einen Fragenkatalog hochladen, anhand derer die KI den Anwender befragt, um daraus Schlüsse zu ziehen.
Es ist nicht Siri
In der Gerüchteküche über Apple hört man davon nichts. Man hört von einzelnen Apps wie »Apple Music«, die automatisch irgendwelche Playlisten erzeugen sollen. Oder von einer besseren Version von Siri. Aber das ist überhaupt nicht das, warum es in Zukunft gehen wird. Es geht um Werkzeuge für Entwickler, damit diese dann tausende von neuen Anwendungen schaffen.
Die neuesten Gerüchte von Mark Gurman behaupten, Apple würde Funktionen zeigen, die den Anwendern in ihrem täglichen Leben helfen (»assist users in their daily lives«). Das klingt nach Siri und nach ein paar Komfort-Funktionen. Aber der eigentlich wichtige Punkt ist: Wird Apple überzeugende APIs für Entwickler bereitstellen, sodass die nächste Revolution losbrechen kann? Oder werden sie nur ein paar eigene Apps etwas verbessern? Darauf sollte wir bei der nächsten WWDC achten.
Apple hat wiederholt neue Funktionen vorgestellt, die sich an den Nutzer anpassen können. Diese Anpassung erfolgte durch maschinelles Lernen. Die Ergebnisse waren teils gut, oft nur vage spürbar und manchmal sogar enttäuschend. Diese Erfahrungen könnten die teils ablehnende Haltung einiger Apple-Nutzer gegenüber der neuen Künstlichen Intelligenz erklären. Dabei handelt es sich jedoch um grundlegend verschiedene Konzepte. Weiterlesen »
Was ist Maschinelles Lernen?
Maschinelles Lernen könnte man beschreiben als "Versuch zu erraten, was der Nutzer möchte". Ein Beispiel hierfür wäre, wenn das iPhone einen Foto-Rückblick einer Reise vorschlägt, die vor einem Jahr unternommen wurde. Das iPhone ist zwar für die Erstellung eines Foto-Rückblicks programmiert. Die Kriterien für ein besonderes Ereignis bleiben jedoch offen. Man könnte sich vorstellen, dass der Nutzer zu einem bestimmten Zeitpunkt besonders viele Fotos gemacht hat. Technisch gesehen wird hier nach einem Muster gesucht, ohne dass die Entwickler genau festlegen müssen, worin dieses Muster besteht. Maschinelles Lernen kann unterschiedlichste Muster erkennen, auch solche, an die noch niemand gedacht hat. Es ist jedoch ein statistisches Verfahren.
Solche ML-Systeme können beeindruckende Fähigkeiten entwickeln, wie das Erkennen von Krankheiten anhand von Röntgenbildern oder Blutanalysen. Sie entdecken kleinste Unregelmäßigkeiten im Gang eines Menschen, die auf eine beginnende Nervenkrankheit hinweisen können. Bei intensivem Training können sie sogar die Genauigkeit erfahrener Ärzte übertreffen. Dennoch gelten diese Systeme nicht als intelligent, da sie lediglich Muster erkennen.
Was ist Künstliche Intelligenz?
Künstliche Intelligenz hingegen kann Aufgaben bewältigen, die bisher Menschen vorbehalten waren. Erstaunlich ist ihre Fähigkeit, Problemstellungen zu verstehen, die von keinem Programmierer explizit eingegeben wurden. Ab einer bestimmten Systemgröße, die bis vor Kurzem unvorstellbar schien, kann eine KI Schlüsse ziehen und Schritt für Schritt Lösungen entwickeln. Die Zuverlässigkeit dieser Antworten ist in manchen Bereichen nicht so hoch wie gewohnt, doch der Vorteil, neue und unvorhersehbare Aufgaben zu lösen, überwiegt deutlich.
Beim maschinellen Lernen muss ein Programmierer jede Funktion explizit programmieren, wobei statistische Daten innerhalb des Programms automatisch entstehen. Ein Beispiel wäre eine Diktierfunktion, die aus Nutzerkorrekturen lernt und sich an Fachbegriffe oder Dialekte anpasst. Der Code ist festgelegt, aber die Daten sind variabel. Da die meisten Nutzer keinen Code schreiben können, sind die Anwendungsmöglichkeiten begrenzt.
Künstliche Intelligenz erfordert keinen vom Nutzer erstellten Code. Die Maschine erkennt selbstständig, welche Schritte notwendig sind, um Nutzerwünsche zu erfüllen, und programmiert sich quasi selbst. Nutzer können komplexe Aufgaben in natürlicher Sprache formulieren und sind in ihrer Aufgabenstellung völlig frei.
Ist es tatsächlich intelligent?
Derzeit weiß niemand genau, warum sich KI-Systeme auf bestimmte Weisen verhalten und welche Fähigkeiten sie besitzen. Ab einer gewissen Skalierung entwickeln sie Fähigkeiten, mit denen Entwickler und Wissenschaftler nicht gerechnet haben. Die neuen Systeme erlangen ihre Fähigkeiten auf Basis einer riesigen Datenmenge quasi von selbst. Es werden ständig neue Fähigkeiten entdeckt, die zuvor unbekannt waren. Auf der grundlegendsten Ebene sind die Funktionen klar und einfach, zumindest für Mathematiker. Doch im großen Maßstab sind die Ergebnisse unvorhersehbar.
Als die ersten Sprachmodelle wie ChatGPT plötzlich weltbekannt wurden, flog der Trick schnell auf. Die KI prognostizierte auf intelligente Weise das nächste Wort, um eine stimmige Antwort zu generieren, die möglichst auf ähnliche Fragen passt. Auf die üblichen Blabla-Fragen bekam man die üblichen Blabla-Antworten. Doch dann entdecke man, dass die Systeme tatsächlich Probleme lösen konnten. Man kann ihnen beispielsweise einen Programmcode vorlegen und sie fragen, ob sie einen Fehler erkennen, den man selber nicht zu finden vermochte.
Die Frage, ob diese Systeme »wirklich« intelligent sind, wird intensiv diskutiert. Es scheint, als habe man ein Prinzip entdeckt, das – weiterverfolgt – zu immer intelligenteren Systemen führt. Dabei basieren die Antworten nicht mehr auf einem »Trick«, sondern auf einer fundierten Analyse von Problemen und ihren Lösungen.
Ein großer Teil der Arbeit, um diese Systeme auf nützliche Antworten zu trainieren, besteht aus Feinabstimmungen durch verschiedene Gewichtungen und Parameter. Es ist, einfach gesagt, eine Tüftelei. Eigentlich sind wir es gewohnt, dass Informatiker und Programmierer mit mathematischer Präzision arbeiten. Bei großen KI-Systemen mit Trillionen von Parametern ist dies jedoch nicht mehr möglich. Man ändert vielleicht eine Gewichtung, die für die »Quasselfreudigkeit« oder für gewisse »kreative Abweichungen« steht, von 0.7 auf 0.8. Und dann schaut man, wie sich das System verhält; also ob es anfängt, zu spinnen.
Eine KI, die Texte für Bücher und Zeitungen erzeugt, muss etwas freier antworten können, als eine KI, die auf eine Klageschrift eines Anwalts reagiert; oder die eine Buchhaltungssoftware auf ein neues Gesetz anpassen soll. Es ergibt sich also (zumindest vorübergehend) die Notwendigkeit, mit viel Tüftelei ein solches Grundsystem auf eine bestimmte Anwendung zu trainieren und zu optimieren.
Das lässt Spielraum für eine Vielzahl von Anbietern. Beispielsweise könnte es eine Firma oder eine Community geben, die ein solches System ganz besonders erfolgreich auf medizinische Fragen trainiert. Eine andere Gruppe könnte dasselbe System zu einem sehr guten Lehrer formen, der über ausgezeichnete pädagogische Fähigkeiten verfügt. Es ist also nicht der Fall, dass eine einzige KI jede nur denkbare Fähigkeit im bestmöglicher Weise bietet. Es ist aber definitiv der Fall, dass eine grundlegende KI in jeder dieser Disziplinen trainiert werden kann.
Es könnten am Ende eine oder zwei Grundsysteme existieren, die von allen Gruppen als Basis benutzt wird — so wie es derzeit bei Betriebssystemen der Fall ist. Analog dazu können auf dieser Basis sehr viele spezialisierte Varianten entstehen — wie es derzeit bei Apps der Fall ist. Man kann leicht erkennen, wie sich das gewohnte System aus »Betriebssystem und App« in Zukunft wandeln wird: Wenn irgendeine Firma (BMW, Miele, Adidas, …) früher eine Software für interne Zwecke geschrieben hätte, und zwar auf Basis von Windows oder macOS, dann wird sie in Zukunft vermutlich eine grundlegende KI für die eigenen Zwecke trainieren. Die »spezialisierte KI« ist sozusagen die »neue App«.
Ob Apple dann zu den wichtigen Anbietern gehören wird, muss man wohl abwarten.
(Die Bilder des Artikels wurden erzeugt mit KI und Stable Fusion.)
Es ist eine Bombe, die nicht ganz unerwartet einschlug: die Eröffnung eines Monopolprozesses gegen Apple durch das amerikanische Justizministerium. Es erinnert an vergangene Zeiten, als Microsoft die IT-Branche dominierte. Nun steht Apple vor ähnlichen Herausforderungen. Die Diskussion darüber ist von großer Bedeutung, weit über bloße AGB-Streitigkeiten der EU hinaus. Die Klage wirft Apple vor, durch sein iPhone eine monopolistische Position auf dem Smartphone-Markt zu nutzen, was sowohl Verbrauchern als auch der Konkurrenz schadet. Dies wirft Fragen auf über Apples Geschäftspraktiken und potenzielle Auswirkungen auf den Markt. Was sind die genauen Vorwürfe und wie wird Apple darauf reagieren? Direkt zum Film »
Angeblich sucht Apple nach einem Partner, der die KI-Technik für die kommenden Versionen von Apples Betriebssystemen bereitstellen kann. Es heißt, Apple wäre dazu (noch nicht) in der Lage. Aussichtsreiche Kandidaten für den Job wären Google und OpenAI. Diese verfügten zudem über die massive Rechenkapazität, die Apple noch fehlt.
Das klingt alles sehr vernünftig. Jedoch gibt es einen kleinen Haken, den man in der Hektik des Nachrichtengeschäfts vermutlich übersah: Apple hat nämlich zwei Milliarden Anwender. Es existiert auf dem gesamten Planeten kein KI-Anbieter, der einen solchen Ansturm bewältigen könnte. Selbst wenn man sie alle kombinieren würde. Weiterlesen »
Angeblich sucht Apple nach einem Partner, der die KI-Technik für die kommenden Versionen von Apples Betriebssystemen bereitstellen kann. Es heißt, Apple wäre dazu (noch nicht) in der Lage. Aussichtsreiche Kandidaten für den Job wären Google und OpenAI. Diese verfügten zudem über die massive Rechenkapazität, die Apple noch fehlt.
Das klingt alles sehr vernünftig. Jedoch gibt es einen kleinen Haken, den man in der Hektik des Nachrichtengeschäfts vermutlich übersah: Apple hat nämlich zwei Milliarden Anwender. Es existiert auf dem gesamten Planeten kein KI-Anbieter, der einen solchen Ansturm bewältigen könnte. Selbst wenn man sie alle kombinieren würde.
Man hört, Siri (oder iMessage) würde in Zukunft alle Fragen beantworten wie ChatGPT. Allerdings wird Siri schlanke 25 Milliarden mal benutzt pro Monat, sagt Yael Garten, einer der für Siri zuständigen Manager. Das sind Größenordnungen, die völlig außer Reichweite sind von allen KI-Systemen, die so ähnlich funktionieren wie ChatGPT oder Gemini. Hinzu kommt, dass Apple-Anwender ihre neuen Spielsachen gerne am ersten Tag ausgiebig testen. Das Desaster beim Launch von MobileMe, bei dem die Server für mehrere Tage komplett lahmgelegt waren, ruft uns in Erinnerung, wie sich ein solcher Ansturm auswirkt.
Wie funktioniert es also?
Alle KI-Anbieter, darunter auch Google und das Gespann aus OpenAI und Microsoft, begrenzen den Ansturm auf zweierlei Weise: Erstens, bei den kostenlosen Systemen handelt es sich um stark abgespeckte Varianten. Bei Überlastung werden neue Anfragen abgelehnt. Zweitens, die leistungsfähigen Varianten sind kostenpflichtig. Und zwar nicht zu knapp. Es gibt verschiedene Stufen, die nicht selten einen fünfzigfachen Preisunterschied aufweisen. Manche Systeme kosten 2 Dollar pro Anfrage. Es ist richtig teuer.
Falls Apple einen kostenlosen KI-Assistenten bietet, dann ist dieser sehr wahrscheinlich in seinen Fähigkeiten am unteren Ende der Skala angesiedelt. Siri könnte vielleicht etwas gesprächiger werden und besser verstehen, was man will. Das wäre schon ein guter Fortschritt. Aber mehr ist kostenlos nicht drin — einfach weil die Kapazität nicht existiert. Vermutlich wird Siri die meisten Funktionen exakt so handhaben wie bisher, und nur wenige Anfragen werden weitergeleitet an die neue KI. Man braucht keine KI, um einen Timer für die Pizza zu stellen.
Eine weitere Möglichkeit wäre, dass es sich um Funktionen handelt, die nicht häufig benutzt werden. Also nicht Siri, sondern vielleicht ein Schreibassistent innerhalb von Pages. Man verstreut ein paar solche Funktionen innerhalb von iWork, Shortcuts oder Safari. Und bei Safari wird’s schon gefährlich.
Kosten im Quadrat
Sehr wahrscheinlich wird Apple die Menge an Informationen begrenzen, die an die KI geschickt werden. Man schickt zwei Dinge an den Server: Den eigentlichen Befehl und den Kontext. Der Kontext kann zum Beispiel ein Dokument sein, das man gerne korrigiert hätte. Je länger der Kontext ist, desto teurer wird es. Die Kosten steigen aber nicht linear, sondern im Quadrat. Mehr als tausend oder zweitausend Zeichen wären geradezu ein Wunder. Ich fände schon 500 Zeichen eindrucksvoll.
Das würde aber ausreichen, damit Siri nicht vergisst, was man vor zehn Sekunden gesagt hatte. Denn bei den KI-Systemen wird im Hintergrund immer der bisherige Verlauf mitgeschickt; auf diese Weise entsteht der Eindruck, die KI würde sich merken, was man zuvor geplaudert hatte. Vielleicht könnte Siri die letzten zwei Anfragen mitsenden.
Eins ist klar: So schnell wie Siri derzeit antwortet (nämlich meist unmittelbar oder überhaupt nicht), kann es per KI nicht funktionieren. Schon deswegen wäre es unklug, einfach alles per KI zu verarbeiten.
Bilderzeugung
In den einschlägigen Meldungen heißt es, die Anwender könnten mit Googles KI-Technik auch Bilder anhand von Text-Kommandos erzeugen. Das schürt Zweifel, ob es sich wirklich um durchgesickerte Informationen handelt. Denn Bilderzeugung gehört zu jenen KI-Aufgaben, die sich durchaus lokal auf den Geräten erledigen lassen. Apple hat eine solche Engine bereits in iOS eingebaut, abgeleitet von »Stable Fusion«, einem Open-Source-Projekt.
Aber wozu soll das gut sein? Vielleicht kann man sich damit ein paar Illustrationen für Pages und Keynote erzeugen lassen. Doch Adobe wird drauf pfeifen. Adobe entwickelt ihre eigene Technik. Dasselbe gilt für Microsoft mit Word und PowerPoint. Warum also sollte Apple sich dafür an Google oder OpenAI wenden? Die Gerüchte sind an dieser Stelle einfach nicht plausibel.
Man mag sich auch fragen, ob Apple wirklich eine Anwendung auf einen Server auslagert, weil sie viel Rechenleistung benötigt? Immerhin verdient Apple seine Brötchen genau damit, dass sie den Grafikprofis sehr schnelle Maschinen verkauft. Wenn die bisherigen Geräte an die Grenze ihrer Leistungsfähigkeit kommen, ist das für Apple sehr gut. Umso eher kaufen die Kunden das neueste Modell.
Kooperation
Es gibt eine weite Bandbreite an Möglichkeiten, sich Partner zu suchen und voneinander zu profitieren. Von Apple wird ein großer Befreiungsschlag gefordert, aber die Technik steht noch ganz am Anfang. Vor allem ist es immens teuer. Man kann nicht erwarten, dass Apple mal eben gratis in iMessage einbaut, worin andere Firmen zehn Jahre und Milliarden an Dollar investiert haben.
Es ist auch aus Sicht der Anwender eine komplexe Technologie. Wer sich nicht intensiv damit beschäftigt, wird kaum verstehen, warum die KI mal geniale und mal törichte Antworten gibt. Apple möchte die Dinge einfach und durchschaubar halten. Sie müssen sich auf jene Anwendungen konzentrieren, die einfach, zuverlässig und nützlich sind. Von dort arbeitet man sich vorwärts.
Es herrscht große Aufregung im Web über die Nachricht, Apple würde angeblich die KI-Technik von Google lizenzieren. Ausgerechnet Google! Aber was bedeutet das eigentlich?
KI ist als Begriff reichlich nebulös und lädt zu mannigfaltigen Missverständnissen ein. Deswegen ist es verblüffend, dass der zugrunde liegende Bloomberg-Artikel nicht genauer nennt, was überhaupt damit gemeint ist. Welche konkrete Aufgabe soll gelöst werden? Was bekommt der Anwender zu sehen? Und was läuft lediglich hinter den Kulissen? Weiterlesen »
Siri 2.0
Nehmen wir Siri als offensichtliches Beispiel. Soll Siri in Zukunft jede mögliche Frage beantworten können, ähnlich zu ChatGPT? Das wäre natürlich gut. Aber was genau würden wir von Siri halten, wenn es uns auf eine komplexe Frage eine ebenso komplexe Antwort geben würde? Selbst kurze Antworten von ChatGPT umfassen oft eine ganze DIN-A-4 Seite. So etwas macht für eine Sprachassistenten überhaupt keinen Sinn. Siri ist dazu da, sehr knappe Informationen zu geben. Siri soll vor allem die Funktionen des iPhones und dessen Apps leicht zugänglich zu machen. Es ist ein Assistent für Funktionen. Was hat das mit Google zu tun?
Die neuen KI-Systeme sind verblüffend gut darin, die Anfragen des Anwenders zu verstehen. Derzeit ist das eine Schwäche von Siri. Geht es also lediglich um irgendeinen Schnickschnack hinter den Kulissen, sodass die Kommandos an Siri besser verstanden werden? Dann wäre es nur eine sekundäre Komponente und all die Aufregung nicht wert.
Aktuelle Daten
Bleiben wir noch etwas bei Siri. Von Siri erwarten wir aktuelle Informationen, ähnlich einer Suchmaschine. Für ganz bestimmte Bereiche lizenziert Apple schon heute die dazu passenden Dienste, beispielsweise Sportergebnisse, Wetter oder Kino. Während Siri nur etwa alle 14 Tage aktualisiert wird, verwendet Apple Live-Datenbanken von Drittanbietern für spezielle Fragen.
Vergleichen wir das mit den modernen KI-Systemen. Sie zu trainieren benötigt jeweils drei bis sechs Monate. ChatGPT basiert hauptsächlich auf Daten, die älter sind als ein Jahr, weil noch Zeit benötigt wird für ein verfeinertes Training der Grundintelligenz. Man sieht daran: Ein solches System, so schlau es auch sein mag, ist zu langsam für Siri.
Geht es also bei der Lizenz einfach um die aktuellen Daten? Google hat vor ein paar Wochen eine interessante Technologie vorgestellt, mit der man die schwerfälligen KI-Daten aktuell halten kann, ohne sie komplett neu zu berechnen. Geht es vielleicht nur um diese Komponente?
Apps, Apps, Apps
Eine sehr interessante Frage besteht darin, wo uns die Intelligenz überhaupt begegnet. Natürlich könnte Apple eine Chat-App programmieren. Doch der eigentliche Clou besteht darin, diese Intelligenz innerhalb von Apps zu verwenden. Nicht nur, weil sie uns dort bei unseren konkreten Aufgaben helfen kann. Sondern vor allem, weil die Entwickler sehr komplexe Aufgaben realisieren können, die den Anwender ansonsten überfordern würden. Es ist nämlich gar nicht so einfach, einer KI mitzuteilen, was man möchte.
Apple wird sicherlich APIs (Programmierwerkzeuge) zur Verfügung stellen, mit denen die Entwickler gut arbeiten können. Andererseits ist es aber auch nicht zwingend erforderlich. Denn letztlich ist es eine triviale Kommunikation mit einem Server. Man kann heute schon eine Textverarbeitung programmieren, die den jeweils aktuellen Text zu einer KI schickt, um ihn auf Fehler zu untersuchen. Der Entwickler benötigt Apple nicht dafür. Er kann selbst entscheiden, welchen der verschiedenen Anbieter er benutzt.
Man kann sich das leicht klarmachen mit Apps, die sowohl unter iOS als auch unter Android, macOS und Windows funktionieren sollen. Der Entwickler entscheidet sich für einen KI-Anbieter und schickt seine Anfragen dorthin. Es ist nicht abhängig von Apple.
Was bedeutet es dann überhaupt noch, wenn es heißt, Apple lizenziert die künstliche Intelligenz von Google? Was sich innerhalb der Apps abspielt, bestimmt nicht Apple. Sondern der Entwickler.
Money, Money, Money
Früher hat Apple den Entwicklern bestimmte Werkzeuge kostenlos überlassen, die eigentlich gutes Geld wert waren. Beispielsweise Datenbanken auf Apples Servern: Viele Apps benutzen im Hintergrund solche Datenbanken, um einen Highscore oder andere Daten des Anwenders zu speichern. Auch die Synchronisierung verschiedener Geräte basiert oft auf diesen kostenlosen Datenbanken. Kostenlos sind sie natürlich nur deswegen, weil Apple von allen Umsätzen eine gute Provision einbehält.
Es wäre durchaus denkbar, dass Apple den Entwicklern erneut ein verlockendes Angebot macht. Künstliche Intelligenz wie ChatGPT oder Gemini ist sehr teuer. Es könnte sein, dass Apple seine KI kostenlos abgibt oder zumindest ein großzügiges Freikontingent einräumt, vorausgesetzt, Apple wäre per AppStore wieder bei den Umsätzen beteiligt.
Wahrscheinlicher ist jedoch, dass die ganze Herrlichkeit etwas kosten wird; und dann liegt es am Anwender (oder am Entwickler), wie er sich entscheidet. Dass es plötzlich eine »Apple-KI« gibt, die sich ungefragt in alles einmischt und der niemand entkommt, ist aus finanziellen Gründen unwahrscheinlich; abgesehen von trivialen Funktionen.
Ich weiß, dass ich nichts weiß
Dieses weise Zitat beschreibt recht gut, was man über den angeblichen Deal zwischen Apple und Google (oder sonstwem) weiß. Betrifft es vielleicht nur Server-Kapazität? Betrifft es nur die »untrainierte« Grund-Intelligenz, die dann von Apple weiter verfeinert wird? Da könnte man in der Tat zusammenarbeiten. Betrifft es aktuelle Daten?
Es ist doch recht verblüffend, dass in den Gerüchten nichts darüber zu erfahren ist. Dennoch findet man in den amerikanischen Foren viel Aufregung, dass Apple jetzt abhängig wäre von der Google-Krake. Wenn man genauer nachfragt, gibt es darauf aber keinen Hinweis.
Künstliche Intelligenz? Gähn. Lasst uns bloß damit in Ruhe. — So oder ähnlich reagieren viele genervte Anwender, die den Hype um KI nicht mehr hören können. Zu lange und zu oft wurde versprochen, dass Siri damit endlich verstehen würde, was wir meinen. Die tatsächlich erbrachten Ergebnisse haben nie viel getaugt. Doch plötzlich gelang ein immenser Durchbruch. Man hat entdeckt, wie es funktioniert. Der Aufwand dafür ist gigantisch, aber die Ergebnisse sind absolut verblüffend. Es ist längst kein Geheimnis mehr: Dies ist die neue Epoche nach der Smartphone-Revolution. Vermutlich sogar größer. In der Sendung möchten wir alle ins Boot holen, die noch skeptisch sind und die nicht wissen, ob sie sich wirklich für das neue Zeug interessieren sollen. Kann nicht einfach alles so bleiben, wie es war? Direkt zum Film »
Apple ist berühmt dafür, seine Hardware exakt auf die Software abzustimmen, und umgekehrt. Das war Apple derart wichtig, dass man sogar die Mühe auf sich nahm, komplett eigene Prozessoren zu entwickeln. Bisher waren die Ziele klar: eine möglichst hohe Performance bei gleichzeitig niedrigem Energieverbrauch und einem besonderen Augenmerk auf eine flüssige Grafik. Mit dem iPhoneX kam zum ersten Mal die Neural Engine hinzu, von der damals noch kaum jemand ahnte, wie wichtig sie werden würde. In den kommenden Jahren (und sehr viel schneller, als wir alle glauben!) werden sich die Anforderungen an Apples Prozessoren dramatisch erhöhen. Künstliche Intelligenz braucht eine brachiale Prozessorkraft. Was wird Apple an seinen Prozessoren vermutlich ändern, um das zu erreichen? Direkt zum Film »
Apple hat stets fleißig daran gearbeitet, sich nicht allein auf den Erfolg des iPhones zu verlassen. Das iPad, die Apple Watch und die Vision Pro sind alles beachtliche und (bis auf die Brille) sehr erfolgreiche Versuche, die Plattform der Zukunft zu entwickeln, bevor die Konkurrenz es schafft. Doch jetzt ist es klar: Die nächste riesige Welle ist Künstliche Intelligenz, und Apple liegt hinten.
Normalerweise waren wir es gewohnt, dass Apple die neuen Plattformen definiert; andere folgten dann in Apples Fußstapfen. Apple rannte von Sieg zu Sieg – sogar die uneinnehmbare Burg von Intels Prozessoren stürmte man mühelos. Doch wenn heute von den atemberaubend leistungsfähigen Prozessoren der Zukunft die Rede ist, meint man nicht Apple, sondern Nvidia. Weiterlesen »
Die neue KI-Plattform
Stellen Sie sich eine riesige Konzerthalle vor, so groß wie ein Stadion. Es tritt aber keine berühmte Band auf, sondern die gesamte Industrie staunt über die Vorstellung eines neuen Prozessors. Im Publikum sitzen keine Teenager und keine hippen YouTuber, sondern die Firmenchefs der größten amerikanischen Unternehmen. Auf der Bühne: Der CEO von Nvidia. Er zeigt einen Prozessor, dessen Entwicklung er sich 10 Milliarden Dollar kosten ließ, und der speziell für die Erzeugung von KI-Modellen gedacht ist.
Anschließend beeilen sich die Chefs der anderen Firmen, artig formulierte Pressemitteilungen zu lancieren. Sie wollen sich dadurch nicht nur bei Nvidia einschmeicheln, weil sie zu den ersten Kunden gehören wollen. Sondern sie wollen der Öffentlichkeit mitteilen, dass sie nicht abseits stehen, sondern dass sie auserwählt und eingeladen wurden, um die neue Zukunft mitzugestalten. Abseits steht: Apple.
Nvidia kann es sich leisten, auf der Liste der Gratulanten selbst Schwergewichte wie Microsoft an die sechste Stelle zu schieben:
Sundar Pichai, CEO von Alphabet
Google Andy Jassy, Präsident und CEO von Amazon
Michael Dell, Gründer und CEO von Dell Technologies
Demis Hassabis, Mitbegründer und CEO von Google DeepMind
Mark Zuckerberg, Gründer und CEO von Meta
Satya Nadella, Vorstandsvorsitzender und CEO von Microsoft
Sam Altman, CEO von OpenAI
Larry Ellison, Vorsitzender und CTO von Oracle
Elon Musk, CEO von Tesla und xAI
Die Revolution
Keineswegs handelt es sich um eine theoretische und esoterische Zukunftstechnologie, die sich vage am Horizont abzeichnet, und über die man sich erst in zehn Jahren konkrete Gedanken machen muss. Sondern wir befinden uns mitten in der Revolution. Neu und ungewohnt ist für uns, mit welchem enormen Tempo sich der Wandel vollzieht.
Der Chip von Nvidia ist für den Einsatz in Rechenzentren gedacht, um die künstlichen Gehirne der Zukunft zu erzeugen. Diese Modelle werden aus 1 Trillion Parametern (also Reglern und Drehknöpfen) bestehen, die eine unsichtbare Hand ganz exakt einstellen muss, damit die Maschine am Ende intelligente Antworten geben kann.
In Zukunft sind Modelle in Reichweite, die aus 10 Trillionen Parametern bestehen. Ein solches Modell wird sehr wahrscheinlich in der Lage sein, ein Abschlussexamen in Chemie, Physik, Mathematik, Biologie, Geschichte oder anderen faktenbasierten Fächern zu bestehen.
Natürlich ist der Chip von Nvidia nicht für ein MacBook oder iPhone geeignet. Er wird vermutlich zwischen 30.000 und 40.000 Dollar kosten. Nun könnte man vorschnell urteilen, dadurch wäre er nicht relevant. Aber genau das ist die Frage: Was ist relevant? — Und man könnte ebenso vorschnell davon ausgehen, dass Apple sich selbstverständlich diese Chips kaufen kann. Tatsache ist jedoch, dass diese superschnellen Chips, die sich für solche KI-Operationen eignen, eine knappe Ware sind. Die Firmenchefs müssen praktisch darum betteln, sie zu bekommen.
Apples Strategie
In den letzten Tagen hat man gelesen, Apple stünde angeblich in Verhandlungen mit Google, um deren KI zu lizensieren. Das ist durchaus möglich. Aber vielleicht geht es nicht nur darum, wer ein funktionierendes KI-Modell anbieten kann. Sondern vielleicht verfügt Apple im Moment nicht über die Rechenleistung, um eigene Modelle schnell genug berechnen zu können. Das sind zwar keine unlösbaren Probleme, aber bis zur nächsten WWDC muss Apple wohl nehmen, was vorhanden ist. Apple hat plötzlich nicht die Zügel in der Hand.
Natürlich wird Tim Cook alles daran setzen, dies zu ändern. Es wird spannend sein, die Entwicklung zu beobachten.
Microsofts damaliger Missbrauch ihrer verschiedenen Monopole, konnte nur durch drastische Maßnahmen der amerikanischen Behörden, aber auch seitens der EU, gebrochen werden. Speziell in der EU wurden damals drastische Strafen ausgesprochen, erstmals in Milliardenhöhe. Nun wurde auch gegen Apple eine solche Strafe verhängt. Ist Apple jetzt genauso schlecht wie es Microsoft damals war? Es geht dabei um die Öffnung des AppStores, zunächst nur für eine ganz bestimmte Kategorie von Anwendungen. In der Sendung legen wir die Argumente der EU Kommission dar, und überlegen uns, wie nachvollziehbar uns diese erscheinen. Anschließend kommt natürlich auch Apple zu Wort. Wurde Apple zu Unrecht verurteilt? Oder hat Apple den Bogen überspannt? Direkt zum Film »
In den nächsten Wochen wird sich bei Apple angeblich sehr viel tun. Viele wichtige Upgrades stehen anscheinend in den Startlöchern. Das berichten übereinstimmend mehrere Quellen, die schon früher korrekte Vorhersagen liefern konnten. Vieles ergibt sich ohnehin von selbst. Die iPads sind schon lange überfällig; und das Frühjahr ist traditionell die heiße Zeit für diese Modellreihe. Es scheint so, als würde Apple die iPads neu ordnen: Der Unterschied zwischen iPad Air und iPad Pro könnte noch größer werden als zuvor. In der Sendung fassen wir zusammen, was derzeit für Gerichte im Umlauf sind, und wägen ab, wie wahrscheinlich sie eintreffen werden. Dabei geht es natürlich nicht nur um die iPads, sondern auch um andere Produkte, beispielsweise Zubehör. Direkt zum Film »
Das MacBook Air scheint derzeit eine perfekte Kombination zu bieten aus Preis, Leistung, Akkulaufzeit und Design. Die Frage ist gar nicht so sehr, ob sich die anvisierten Käufer ein MacBook kaufen; sondern eher, wann der richtige Zeitpunkt dafür gekommen ist. Mit den M-Prozessoren macht man ohnehin nichts falsch, aber man möchte sein Geld natürlich zum besten Zeitpunkt ausgeben, wenn alle zu erwartenden Neuheiten tatsächlich eingebaut wurden. Nun ist also der M3 auch in den MacBook Air gelandet: Der fortschrittlichste Prozessor, den Apple bisher konstruiert hat. Ist das der perfekte Zeitpunkt für einen Kauf? In der Sendung fassen wir die Neuheiten zusammen, und diskutieren darüber, wie groß die Verbesserungen in der Praxis tatsächlich ausfallen. Direkt zum Film »
Die Frage klingt töricht, weil Computer so viele unterschiedliche Dinge für uns tun können, dass man sie in einer kurzen Antwort nicht alle nennen kann. Und trotzdem: Während der verschiedenen Revolutionen, in deren Mittelpunkt der Computer bislang stand, änderten sich diese Dinge.
Das Bild oben wurde mit KI auf einem Mac erzeugt. Der Befehl lautete: young man, Apple Computer, handsome, casual, natural, realistic, photographic, looking at computer, 35mm, very high detail, focus on computer.
Es begann mit Datenverarbeitung. Das ist zwar heute noch das Fundament aller Anwendungen. Aber niemand würde heutzutage sein Smartphone aus der Tasche holen und sagen: "Ich verarbeite jetzt Daten." Weiterlesen »
Die Revolutionen folgten einem ganz bestimmten Pfad. Sie eroberten sich Medium um Medium: Zuerst waren es Zahlen, dann Texte, dann Grafiken, dann Töne und zum Schluss Video. Dann übernahm das Internet. Für die meisten Anwender ist das aktuelle Medium die Kommunikation, die allerdings nicht so einfach zu fassen ist.
Als Erwachsene benutzen wir Computer, um damit unsere Arbeit zu erledigen. Aber in der überwältigenden Mehrzahl der Fälle handelt es sich schlicht um Kommunikation.
Dieser Grund wird sich in Kürze erneut wandeln. Wir werden Computer benutzen, damit sie etwas für uns tun, wovon wir selbst zu wenig verstehen oder wozu wir selbst zu wenig Zeit haben. Textverarbeitung wird nicht mehr bedeuten, dass wir Texte eingeben und editieren. Bildbearbeitung wird nicht mehr bedeuten, dass wir mühsam die Kniffe von Photoshop erlernen oder dass wir mühsam eine Fotografie erstellen, nur um herauszufinden, dass sie nicht genau das zeigt, was wir zeigen möchten.
Sondern wir werden dem Computer mitteilen, welche Texte und Bilder wir gerade benötigen, und er wird diese für uns erzeugen. Er wird es auf eine Weise tun, die weit über unsere Fähigkeiten hinausgeht. Unsere Aufgabe besteht darin, möglichst genau zu beschreiben, was wir wünschen, um anschließend die Ergebnisse zu kritisieren und eine bessere Version zu verlangen.
Das Bild oben wurde mit KI auf einem Mac erzeugt. Der Befehl lautete wie oben, nur wurde das Wort "man" durch "woman" ersetzt.
Apple gelang bisher der Sprung von einer Revolution zur nächsten. Von Texten zu Desktop Publishing, zu Musik, zu Video und schließlich zur mobilen Revolution. Doch der nächste Umbruch ist ganz anderer Art. Es ist keineswegs garantiert, dass Apple hierbei eine Rolle spielen wird. (Es ist andererseits aber durchaus möglich.) Bisher konnte Apple immer von seiner Expertise bei Hardware und User-Interfaces profitieren. Die neue Revolution verlangt aber etwas ganz anderes anderes.
Das Bild oben wurde mit KI auf einem Mac erzeugt. Der Befehl lautete: "2 teenager 16 years playing with their smartphones, handsome, casual, blonde hair, natural, realistic, photographic, looking at camera, 35mm, very high detail, focus on computer, pores, natural skin"
Ich möchte ein Beispiel geben. Bei Mac-TV verwenden wir eine kleine selbstgeschriebene App, um uns während der Live-Sendung zu Wort zu melden, die Redezeiten einzuhalten und so weiter. Jeder von uns hat neben sich ein iPhone liegen, welches durch sein Mikrofon und ein paar Buttons diese Funktion ermöglicht: Es hört mit, und es weiß, welcher Teilnehmer als Nächstes an der Reihe ist.
Nun kommt der Punkt. Mit einem kleinen Schieberegler kann ich die Dauer eines Themas vorgeben. Die anderen Teilnehmer sehen dadurch, wie viel Zeit noch übrig ist. Durch die hellen Scheinwerfer im Studio ist es für mich manchmal schwierig zu erkennen, auf welchen Wert der Regler eingestellt ist. Deswegen wünsche ich mir, wann immer ich den Regler verschiebe, eine riesig große Anzeige im oberen Bereich der App. Ich möchte, dass es so aussieht, als wenn man unter macOS die Bildschirmhelligkeit einstellt: ein helles halbtransparentes Viereck, mit einer großen Zahl. Es soll sich einblenden, sobald ich den Regler betätige, dann soll es 3 Sekunden stehen bleiben und dann soll es innerhalb 1 Sekunde sanft ausblenden.
Dies zu programmieren habe ich einer Künstlichen Intelligenz zur Aufgabe gestellt. Ich habe den bereits vorhandenen Code übergeben und dann einfach meine Wünsche in deutscher Sprache beschreiben. Die KI hat den Code ergänzt und wieder ausgegeben. Den neuen Code habe ich übernommen – und voila! Es hat sofort funktioniert.
Das ist absolut haarsträubend. Denn die künstliche Intelligenz musste dafür mein durchaus kompliziertes (und keineswegs alltägliches) Anliegen verstehen. Außerdem musste es den Sinn meines von Hand geschriebenen Codes durchschauen und genau erkennen, an welcher Stelle welcher Code eingefügt werden muss, damit alles zusammenpasst. Anschließend konnte ich noch ein paar Änderungswünsche nachschieben, um das Design anzupassen. Schritt für Schritt hat die KI meine Vorstellungen umgesetzt.
Erneut: haarsträubend. Wenn dies erst der Anfang ist, dann ist es der Anfang einer gewaltigen Revolution.
Ich habe die künstliche Intelligenz von Google benutzt (Gemini 1.5). Diese gehört zu den besten, die derzeit verfügbar sind, und es ist komplett kostenlos. Auch das ist haarsträubend. Es ist jedoch zu erwarten, dass solche Dienste bald teuer verkauft werden.
Unsere Smartphones werden wir weiterhin zur Kommunikation und zur Unterhaltung benutzen. Aber das wird uns schon bald nicht weiter bemerkenswert vorkommen. Dieses Feld ist sozusagen abgegrast. Was in Zukunft die Spreu vom Weizen trennen wird, sind solche Assistenzfunktionen. Der Computer soll etwas für uns erledigen, von dem wir nicht wissen, wie es funktioniert; von dem wir aber wissen, wie das Ergebnis aussieht. Computer, die dies nicht können, werden vom Markt verschwinden. Sie werden genauso verschwinden, wie normale Handys vom Markt verschwunden sind. Wir telefonieren weiterhin, aber das ist eine sekundäre Funktion von WhatsApp oder irgendeiner anderen App.
Apple ist in diesem neuen Wettrennen noch nicht sichtbar. Und trotzdem: Diesen Text habe ich komplett durch Apples enorm gute Diktierfunktion diktiert. Die Geschwindigkeit, mit der ich den Text erzeugen konnte, ist völlig unglaublich. Aus Stunden wurden Minuten. Am Ende habe ich den Text einer künstlichen Intelligenz vorgelegt und um Korrekturen gebeten. Korrigiert wurden Rechtschreibung, Satzbau und Dramatik. Das Ergebnis mag jeder selbst beurteilen.
Kann das wirklich wahr sein? Angeblich hat Apple eines seiner ehrgeizigsten Projekte eingestellt. Es bestand darin, ein autonomes, selbstfahrendes Auto zu entwickeln. Das hat Tim Cook sogar bestätigt. Ungewiss ist, in welchen Etappen das Ziel erreicht werden sollte. Aber damit ist nun offenbar Schluss. In der Sendung fassen wir die Meilensteine der Entwicklung zusammen, die durch zahlreiche Personalentscheidungen illustriert werden. Anschließend diskutieren wir, woran das Projekt gescheitert sein könnte. Denn andere Startups haben es durchaus geschafft, eine Automobil-Produktion in wenigen Jahren aus dem Boden zu stampfen. Gibt es womöglich die Chance, dass das Projekt später wieder aufgenommen wird? Direkt zum Film »
Künstliche Intelligenz? Gähn. Lasst uns bloß damit in Ruhe. — So oder ähnlich reagieren viele genervte Anwender, die den Hype um KI nicht mehr hören können. Zu lange und zu oft wurde versprochen, dass Siri damit endlich verstehen würde, was wir meinen. Die tatsächlich erbrachten Ergebnisse haben nie viel getaugt. Doch plötzlich gelang ein immenser Durchbruch. Man hat entdeckt, wie es funktioniert. Der Aufwand dafür ist gigantisch, aber die Ergebnisse sind absolut verblüffend. Es ist längst kein Geheimnis mehr: Dies ist die neue Epoche nach der Smartphone-Revolution. Vermutlich sogar größer. In der Sendung möchten wir alle ins Boot holen, die noch skeptisch sind und die nicht wissen, ob sie sich wirklich für das neue Zeug interessieren sollen. Kann nicht einfach alles so bleiben, wie es war?
Zwei Themen schafften es in unsere muntere Rundschau. Erstes Thema: Die Programmierung künstlicher Intelligenz mit Prompt Engineering, die Nutzung von Few-Shot-Examples, und all das verbunden mit dem Mac und mit Shortcuts. Klingt kompliziert! Aber es handelt sich um einfache und dennoch höchst wirksame Methoden, um einer KI beizubringen, was man haben möchte. Jörn wird zeigen, wie man auf dem Mac einen Text aus einem Video extrahiert und daraus einen Einleitungstext für eine Webseite bastelt. Automatisch und ohne weitere Software. — Zweites Thema: Der Browserkrieg ist wieder eröffnet! Microsoft zwängt sich frech zwischen Chrome und Anwender. Wir haben Beweise!
Live-Sendung fast jeden Sonntag um 19 Uhr mit zahlreichen Themen, Live-Chat und Votings. Login ab 18:50 Uhr, Start um 19 Uhr. Wiederholung der Beiträge im Archiv.