PUR

Lieder durch Summen erkennen - so geht's


Bild: <span>Blanscape/Shutterstock.com</span>

Sie bekommen ein Lied nicht mehr aus dem Kopf, doch Sie kennen weder dessen Namen noch den Text? Google bietet jetzt eine neue Funktion, bei der Sie einfach die Melodie summen können und die Suchmaschine liefert Ihnen dann den Titel. Wie Sie die Funktion nutzen, lesen Sie im Folgenden.

So summen Sie Google Ihren Ohrwurm vor

Um die neue Funktion auf Ihrem Smartphone zu nutzen, öffnen Sie die neueste Version der Google-App oder des Google Assistants. Tippen Sie dort auf das Mikrofon-Symbol und sagen Sie "Was ist das für ein Lied?". Beginnen Sie dann 10 bis 15 Sekunden lang zu summen.

Nachdem ein Lied gesummt wurde, hilft Googles maschineller Lernalgorithmus dabei, potenzielle Übereinstimmungen zu identifizieren. Sie können dann die beste Übereinstimmung auswählen und Informationen über den Song und den Künstler erhalten, alle begleitenden Musikvideos ansehen, den Text finden, die Analyse lesen oder den Song über die Streaming-App Ihrer Wahl anhören.

Wie Maschinen Melodien lernen

Wie funktioniert diese neue Funktion von Google? Einfach gesagt: Die Melodie eines Songs ist wie sein Fingerabdruck. Jeder hat seine eigene, einzigartige Identität. Google hat lediglich maschinelle Lernmodelle entwickelt, die Ihr Summen, Pfeifen oder Singen dem richtigen "Fingerabdruck" zuordnen können.

Wenn Sie also eine Melodie in Googles Suche summen, wandeln die maschinellen Lernmodelle das Audio in eine zahlenbasierte Sequenz um, die die Melodie des Songs repräsentiert. Diese Modelle sind darauf trainiert, Lieder zu identifizieren, die auf einer Vielzahl von Quellen basieren - einschließlich Menschen, die singen, pfeifen oder summen, sowie Studioaufnahmen. Die Algorithmen entfernen auch alle anderen Details, wie begleitende Instrumente und das Timbre und den Ton der Stimme. Was übrig bleibt, ist die nummernbasierte Sequenz des Songs, der sogenannte Fingerabdruck. Diese Sequenzen werden dann mit Tausenden von Songs aus der ganzen Welt verglichen und mögliche Übereinstimmungen werden in Echtzeit identifiziert.

Mehr zum Thema: