Neben dem allseits bekannten ChatGPT bietet OpenAI mittlerweile auch eine ganze Reihe von Schnittstellen, mit der KI-basiert weitere Medien erstellt bzw. umgewandelt werden können.

Die Audio API kann Text in Audio umwandeln oder den Ton aus Audio- und Videodateien transkribieren. Zur Transkription kommt das Whisper-Modell zum Einsatz, das man open source sogar am eigenen Computer nutzen kann. Wenn dafür die Rechenleitung aber nicht ausreicht oder es eilt, kann man gegen eine überschaubare Gebühr die cloud-basierte Variante nutzen.

Meet aidio: Eine Oberfläche für die API

Anders als bei ChatGPT stellt OpenAI dafür keine grafische Oberfläche für Endkunden bereit. Deshalb entwickle ich gerade aidio:

So hört sich das Ergebnis an (Englisch, Deutsch, Ukrainisch)

aidio wird eine App im Einmal-Kauf sein und für iOS, Android und MacOS über die jeweiligen App Stores verfügbar sein – ohne Abo! Die Abrechnung erfolgt direkt über das eigene OpenAI Benutzerkonto. So bezahlt man nur, was man wirklich nutzt, und man kann die Dienste günstige ganz ohne Preisaufschläge nutzen.

Stay tuned 😄