Aus dem Englischen „How does Shazam work“ - mit freundlicher Genehmigung von Christophe Kalenzaga. Übersetzung ins Deutsche durch Matheretter.
Hast du dich schon mal gefragt, wie Shazam funktioniert? Ich hatte mir diese Frage vor ein paar Jahren gestellt und einen Forschungsartikel gelesen, den der Mitbegründer von Shazam, Avery Li-Chun Wang, geschrieben hat. Mein Ziel war es, die Magie hinter Shazam zu verstehen. Die kurze Antwort auf die Frage heißt „Audio-Fingerabdruck“, doch was zum Teufel ist das?
Als ich Student war, habe ich nie einen Kurs in Signalverarbeitung besucht. Um Shazam wirklich zu verstehen (und nicht nur eine vage Idee davon zu haben), musste ich bei Null beginnen und mich mit den Grundlagen befassen. Dieser Artikel ist eine Zusammenfassung meiner Recherchen, um Verfahren zur Songerkennung zu verstehen.
Ich werde mit den Grundlagen der Musiktheorie beginnen, die Signalverarbeitung vorstellen und mit den Mechanismen hinter Shazam abschließen. Du brauchst keinerlei Kenntnisse, um diesen Artikel zu verstehen. Da es sich jedoch um Informatik und Mathematik handelt, ist es von Vorteil, ein wenig Fachwissen zu haben (besonders für die letzten Kapitel). Wenn du bereits weißt, was die Wörter „Oktaven“, „Frequenzen“, „Sampling“ und „spektrale Lecks“ bedeuten, kannst du die ersten Kapitel überspringen.
Tipp: Es ist ein etwas längerer Artikel, du kannst jedoch jedes Kapitel separat - also zu verschiedenen Zeiten - lesen.