•
KI-Werkzeuge sind inzwischen in der Lage, einige der offenen Erdos-Probleme eigenständig zu bearbeiten, vor allem jene mit geringerem Schwierigkeitsgrad, die wahrscheinlich schon gelöst wurden, aber noch nicht in der Datenbank aktualisiert sind.
•
Das neue Framework mHC behebt Probleme von Hyper-Connections, indem es deren Residualverbindungen auf spezielle Mannigfaltigkeiten projiziert. Dies stellt die Identitätsabbildung wieder her und sorgt für stabileres, effizienteres Training sowie bessere Skalierbarkeit großer KI-Modelle.
•
GR-Dexter ist ein Framework für sprachgesteuerte Manipulation mit einem bimanualen Roboter, der hochgradig dextröse Hände besitzt. Die Kombination aus innovativer Hardware, teleoperativer Demonstrationserfassung und hybrider Trainingsstrategie erhöht die Robustheit in der realen Anwendung für bekannte und neue Aufgaben.
•
Dieser Artikel zeigt, wie Angreifer mit gezielten Belohnungsfunktionen in Reinforcement Learning ein 235 Milliarden Parameter großes Modell manipulieren können. Mithilfe der Tinker API lassen sich schädliche Verhaltensweisen auslösen, ohne die grundlegenden Fähigkeiten des Sprachmodells zu beeinträchtigen, unter Nutzung von GRPO und kostengünstiger Infrastruktur.
•
DeepSeek präsentierte eine innovative Methode zur KI-Entwicklung namens Manifold-Constrained Hyper-Connections (mHC). Diese Technik steigert die Skalierbarkeit und reduziert gleichzeitig den Rechen- und Energieaufwand bei der Ausbildung komplexer KI-Systeme. DeepSeek plant, sein großes Modell R2 bald zu veröffentlichen, voraussichtlich zum chinesischen Frühlingsfest im Februar.
•
Chinesische Unternehmen haben für 2026 bereits über 2 Millionen Nvidia-Grafikchips der Hopper-Generation bestellt. Nvidia verfügt derzeit über etwa 700.000 Einheiten auf Lager. Die Chips mit einem Preis von rund 27.000 US-Dollar könnten so mehr als 54 Milliarden US-Dollar Umsatz erzielen. Die Auslieferung an China soll vor dem chinesischen Neujahrsfest am 17. Februar beginnen.
•
OpenAI hat interne Teams umstrukturiert, um die Entwicklung von Audio-KI-Modellen voranzutreiben, mit dem Ziel, innerhalb eines Jahres ein primär auf Audio basierendes persönliches Gerät zu veröffentlichen. Dieser Schritt entspricht dem allgemeinen Trend der Branche hin zu sprachbasierten Schnittstellen, wie sie auch Unternehmen wie Meta, Google und Tesla verfolgen.
•
Ein 65-minütiges Video erklärt die Funktionsweise von Claude Code und beleuchtet wichtige Erkenntnisse zu modernen Agenten-Architekturen an der Spitze der Forschung.
•
Beim Startup Lovable verändert sich aufgrund schneller KI-Entwicklung und Nutzererwartungen alle drei Monate der Product-Market-Fit. Langfristiges Wachstum ist dadurch schwierig, selbst bei einem Umsatz über 200 Millionen USD, weshalb ständige Anpassung unabdingbar ist.
•
Der kostenlose Open-Source-Lehrtext zu Harvards Kurs CS249R behandelt Deep Learning und Reinforcement Learning mit praktischen Beispielen und Vorlesungen und ist online verfügbar.