Tote Sprecher leben wieder!

    Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen zum Thema Cookies finden Sie hier und in unserer Datenschutzerklärung

    • Die Samples würden mich schon interessieren. Auf Instagram gibt es auch jemanden, der bereits diverse Sprecher von den drei ??? geklont hat (u.a. Andreas von der Meden, Katharina Brauren und Peter Pasetti). Sein Pasetti klingt allerdings etwas "dumpf". Wäre interessant mal zu vergleichen ;)
    • Danke. Ich habe gerade mal reingehört. Das ist schon echt beeindruckend. Wenn der Programmanbieter jetzt noch an der Betonung der Sprecher arbeitet (meines Erachtens nach zu ca. 80-85% schon perfekt), bzw. die KI nicht nur lernt, die Texte realistisch vorzulesen, sondern auch inhaltlich zu verstehen, könnte ich mir vorstellen, meine Hörbücher in Zukunft von einer KI vorlesen zu lassen.
    • @Jens Mueller
      Die haben das bei ElevenLabs schon clever gemacht: Bei der Variante, die mein Freund gebucht hat, "Voice Cloning", hast du pro Stimme 25 Samples zum Upload frei, wobei die Größe der Samples nicht begrenzt ist, aber am Ende die Qualität der Stimme ausmacht. D.h. je größere Samples du zusammenschneidest (also je mehr Zeit und Aufwand du reinsteckst), desto besser werden die Stimmen, Intonation, Erregung, Pausen steuert die KI-gestützte Stimme dann aber selbst. Dann hast du ein gewisses Kontingent an Wörtern pro Stimme, die du sprechen lassen kannst, ich weiß es nicht mehr, 5000 oder so, jedes weitere Wort kostet extra. Und wenn ich meinen Freund richtig verstanden habe, gibt es dann pro Tag auch noch ein Limit an Stunden, mit dem du mit deinem Account auf der Plattform schaffen kannst, damit das nicht Überhand nimmt. 25€ pro Monat kostet das Paket.
    • Wiebitte schrieb:

      "Voice Cloning"
      Weißt du, welche Methode er da beim "Voice Cloning" genau benutzt hat? Ich hatte mir eben mal ein paar Erfahrungsberichte durchgelesen und gesehen, dass es bei der Variante, die dein Freund gebucht hat, zwei Möglichkeiten gibt: Einmal das Instant-Voice Cloning, wo der Stimmklon direkt fertig ist und einmal das Professional Voice Cloning, wo die Erstellung des Klons wohl bis zu 4 Wochen dauert, wo die Qualität aber auch entsprechend besser sein soll.


      Wiebitte schrieb:

      D.h. je größere Samples du zusammenschneidest (also je mehr Zeit und Aufwand du reinsteckst), desto besser werden die Stimmen, Intonation, Erregung, Pausen steuert die KI-gestützte Stimme dann aber selbst.
      Lesungen & Hörbücher sind da wohl das beste Quell-Material. Obwohl man hier auch beachten muss, dass bei Verwendunger mehrerer Hörbücher die Klangqualität bzw. Abmischung ähnlich sein sollte. Manche Abmischungen sind im ton dunkler, manche heller, mal sitzt der Sprecher bei den Aufnahmen nah am Mikrofon, manchmal etwas weiter weg, mal gibt es viel hall im Studio, mal weniger und gerade bei älteren Lesungen ist oft noch ein Hintergrundrauschen zu hören. Wenn das nicht entfernt wird, ist es bei den Klonen am Ende natürlich auch zu hören.
    • Vielleicht sollte ich mich mal an der Stelle einschalten: Ich bin der Freund, den Wiebitte meint. Ich habe zwar das Creator-Abo momentan, aber kann das Professional Voice Cloning nicht nutzen. Bei diesem darf soweit ich weiß, nur die eigene Stimme verwendet werden um Missbrauch auszuschließen. Nach Upload der Samples verlangte das Programm einen Abgleich um sicherzugehen, dass es sich wirklich um meine Stimme handelt.

      Ich würde vielleicht noch abschließend bitten, das Sample nicht allzuweit zu verbreiten, wenn möglich ;) Danke euch.
      Liebe Grüße
      CharlesRegnier
    • CharlesRegnier schrieb:

      Ich würde vielleicht noch abschließend bitten, das Sample nicht allzuweit zu verbreiten, wenn möglich
      Da es hier von @Wiebitte eingestellt wurde, haben wir allerdings auch keinen Einfluss darauf, wie weit das Sample u.U. verbreitet werden könnte.
      Wir sind im www. ;)
      Ich habe nicht vor, es persönlich an irgendwen weiterzugeben oder jemanden darauf hinzuweisen, dass es hier zu finden ist.
    • Ich habe mir die 3 Samples mal angehört.
      Für mich ist keins überzeugend.
      Die Klangfarben sind sehr ähnlich, das wars aber. Keine Intention oder Spiel erkennbar.
      Pasetti klingt für mich komplett anders, als in seinen Rollen als Skeletor oder Sherlock Holmes oder auch in Interviews.
      Das ist weit entfernt von Pumuckl V2.
      Ganz nett ist mein Gedanke.
    • @Marco
      Richtig, natürlich gibt es einen Unterschied, ich glaube nicht, dass Karussell nur 25€/Monat bereit war in die Stimme von Clarin zu investieren ;) Das eine ist kommerziell, was du auf den Ohren hattest, ist Hobby, vielleicht Leidenschaft, Neugier, Pioniergeist und vielleicht ein bißchen Zauber, wenn es denn gelingt, was man damit alles könnte anfangen ... ;) Profi vs. Amateur - du verstehst? Und da steckt viel Arbeit drin, du mußt möglichst viel Stimmenmaterial der Urstimme zusammenschneiden, je besser das Material mit dem du die KI anlernst, desto besser das Ergebnis. Geräusche, Störgeräusche, Musik, alles nicht gut für's Einlernen. Reine Stimme, so gut es eben geht, je mehr, desto besser. Joah, und schneid das alles mal zusammen, da hast du zu tun.
      Ich will hier niemand überzeugen und mir ist klar, dass hier Profis sitzen, die natürlich am gesprochenen Wort einwandfrei erkennen können, ob etwas vorgelesen, dahergesagt oder aus tiefster Überzeugung gespielt ist, aber - nochmal - dafür dass sich ein absoluter Laie eines Stücks Technik bedient, finde ich die Samples als auch das halbstündige Märchen echt ein bemerkenswertes Ergebnis. Mir ist aber klar, dass nicht jeder zu diesem Schluß kommen kann ;)
    • Ein weiteres Sample mit einem bemerkenswerten Feature: Vincent Price!
      workupload.com/file/GkhqawLZGUJ
      Was außer uns niemand wußte: Vincent Price konnte fließend Deutsch sprechen! ;) Das ist schon schrill. Näher am Thema sind wir dann als er den Text von "Thriller" vorträgt, was er ja wirklich getan hat ...
      Viel Spaß!
      Wie gesagt, nicht von mir, von meinem Freund, er meinte, das waren ungefähr 1.5 Stunden an "Arbeit" auf der besagten Plattform gewesen ;)
    • Wiebitte schrieb:

      Ein weiteres Sample mit einem bemerkenswerten Feature: Vincent Price!
      Das ist die erste Aufnahme, die mir um ehrlich zu sein nicht ganz so zugesagt hat.

      Wiebitte schrieb:

      Richtig, natürlich gibt es einen Unterschied, ich glaube nicht, dass Karussell nur 25€/Monat bereit war in die Stimme von Clarin zu investieren
      Hier muss man aber auch anmerken, dass für die neue Pumuckl-Serie ein ganz anderes Verfahren zur Reproduktion von Clarins Stimme genutzt wurde.
      Mitlerweile gibt es dieses Speech to Speech Feature auch für ElebenLabs und könnte für noch bessere Ergebnisse sorgen, da die Ursprüngliche Aufnahme, auf die dann der entsprechende "Stimmfilter" gelegt wird, auch aus einem professionell eingesprochenen Hörbuch stammen kann.
      Ich habe es mal mit einer von ElevenLabs vorgefertigten Stimme und einem von Christoph Maria Herbst eingelesenen Hörbuch probiert. Hier gab es im Vergleich zu dem einfachen Text-To-Speech-Verfahren deutlich mehr Varianz in der Darbietung und es wieß eine meines Erachtens nach deutlich höhere Qualität auf. Wäre für mich interessant zu erfahren, wie diese Methode mit geklonten und nicht vorgefertigten Stimmen funktioniert.