KI-Update kompakt: OpenAI, Prompt Engineering, KI-generierte "Fotos", LangSplat

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 5 Min.
Inhaltsverzeichnis

OpenAI hat Insidern zufolge zum Jahresende seinen Umsatz weiter steigern können. Hochgerechnet aufs Jahr ergäbe das eine Umsatzsteigerung von 20 Prozent auf 1,6 Milliarden US-Dollar, berichtet The Information. Dieses Wachstum soll auch auf die erfolgreiche Performance von ChatGPT und den Verkauf von ChatGPT-Abonnements zurückzuführen sein.

Damit bliebe OpenAI weiterhin führend im KI-Sektor, dicht gefolgt vom Startup Anthropic, das bis Ende 2024 einen Jahresumsatz von über 850 Millionen US-Dollar erwartet. Bei OpenAI sprechen einige Manager hingegen von Umsatzerwartungen von 5 Milliarden US-Dollar oder mehr für 2024.

Das schlägt sich auch in den Erwartungen nieder: Anthropic strebt eine Bewertung von 15 bis 18 Milliarden US-Dollar an, OpenAI hingegen eine Bewertung von 100 Milliarden US-Dollar. Allerdings könnten Gerichtsverfahren in Bezug auf Datennutzung und mögliche Urheberrechtsverletzungen erhebliche Auswirkungen auf die Rentabilität der Unternehmen und die Weiterentwicklung der Technik haben.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Die kürzlich von OpenAI verschickten E-Mails über geänderte Nutzungsbedingungen und Datenschutzrichtlinien haben bei den Kunden für Verwirrung gesorgt. Die E-Mails, die am 26. und 27. Dezember verschickt wurden, enthielten identische Inhalte und gaben an, dass die Änderungen ab Februar in Kraft treten sollen.

Die Richtlinien betreffen teilweise Nutzer im Europäischen Wirtschaftsraum (EWR), der Schweiz und dem Vereinigten Königreich, was für Unklarheiten sorgt. Zudem funktionierten die in den E-Mails enthaltenen Links zu den Geschäftsbedingungen anfangs nicht.

Laut den E-Mails ist OpenAI Ireland Limited ab dem 15. Februar für Nutzer im EWR und der Schweiz zuständig. Allerdings wurde bereits im September ein OpenAI-Büro in Irland eröffnet und die Geschäftsbedingungen wurden im November geändert, mit Gültigkeit ab dem 14. Dezember 2023. Die Mail verweist auch auf diese Version, die weiterhin auf der OpenAI-Website zu finden ist.

Die in den E-Mails enthaltenen Links funktionieren inzwischen und führen zu den Geschäftsbedingungen und einer FAQ-Seite. In der FAQ wurde das Datum auf Februar geändert. OpenAI gab in den E-Mails an, dass sie ihren eigenen Chatbot ChatGPT zur Formulierung der Geschäftsbedingungen und Datenschutzerklärung verwendet haben.

Logan Kilpatrick, zuständig für Entwicklerbeziehungen bei OpenAI, sieht Prompt Engineering als "Fehler und nicht als Funktion". Er erwartet, dass der Prompting-Aufwand für gute Ergebnisse in Zukunft um den Faktor 10 reduziert wird.

Kilpatrick betrachtet die Zukunft des Promptings als eine Fähigkeit, die der effizienten Kommunikation mit Menschen ähnelt. KI-Systeme sollten die "harte Arbeit" übernehmen, um detaillierte Prompts zu formulieren, sodass spezielle Prompts zwar die Leistung noch leicht erhöhen könnten, aber nicht mehr unbedingt erforderlich wären.

OpenAI hat bereits ein ähnliches System für DALL-E 3 in ChatGPT implementiert, bei dem GPT-4 im Hintergrund detaillierte Prompts für jedes von Benutzern gewünschte Bild erstellt. Große KI-Unternehmen wie Google und Microsoft verwenden komplexe Prompts, um in Benchmarks wie Googles Gemini Ultra und Microsofts GPT-4 Spitzenleistungen zu erzielen. Auch außerhalb solcher Benchmarks sind Prompts wichtig, da die Ausgabequalität in der Praxis je nach Prompt erheblich variieren kann.

Nikon, Sony und Canon arbeiten gemeinsam an einer Technik, um Echtheit von Fotos zu gewährleisten und sie von KI-generierten Bildern zu unterscheiden. Laut Nikkei Asia planen die Unternehmen, digitale Signaturen in Fotos einzubetten, die mit ihren Geräten aufgenommen werden. Ein gemeinsamer Standard soll zugrunde liegen, und einige bereits verkaufte Kameras könnten durch Firmware-Updates die Signaturfunktion erhalten.

Ein Online-Werkzeug namens "Verify" wurde bereits entwickelt, um die Authentizität von Bildern zu überprüfen. Im Frühling soll die Technik per Update in drei professionelle spiegellose Kameras von Sony eingeführt werden, während Canon in diesem Jahr eine Kamera mit eigener Variante verkaufen will, die auch Signaturen in Videos einfügt. Nikon plant ebenfalls eigene Kameras für Fotojournalisten und professionelle Fotografen, jedoch sind weniger Details bekannt.

Da die japanischen Hersteller 90 Prozent des weltweiten Kameramarkts kontrollieren, könnte der Standard entscheidend dazu beitragen, echte Fotos von generierten Bildern zu unterscheiden, insbesondere angesichts der schnell verbesserten KI-Bildgeneratoren.

Wissenschaftler der Tsinghua-Universität und der Harvard-Universität haben ein KI-System namens LangSplat entwickelt, das eine effiziente und genaue Suche in 3D-Räumen ermöglicht. LangSplat erstellt sogenannte 3D-Sprachfelder, indem es eine Technologie zur Rekonstruktion von 3D-Daten aus Bildern mit einem Bilderkennungsmodell kombiniert. Das Ergebnis ist eine 3D-Umgebung, in der alle Objekte und Objektteile klar voneinander getrennt und beschriftet sind.

LangSplat verwendet 3D-Gaussians, die sich derzeit als Alternative zu NeRFs etablieren, die ebenfalls für 3D-Repräsentationen verwendet werden. Dadurch ist LangSplat schneller und genauer als bisherige Ansätze. Die Forscher demonstrierten beispielsweise, wie das System einzelne Bestandteile einer Suppe unterscheiden kann.

Die Technologie ermöglicht die Durchsuchbarkeit von 3D-Räumen und könnte eines Tages zu einer Art Google des Metaverse werden. Abseits der Suche könnten 3D-Sprachfelder auch in anderen Bereichen Anwendung finden, wie zum Beispiel beim Training von Robotern oder in der Logistik.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

(igr)