멀티미디어신호처리
DSP 활용 .. Music Search App
라구넹
2024. 10. 16. 03:37
원리: 패턴 인식
AI랑은 좀 다르거나 일부
노래가 100곡 있다고 가정
디지털이니 샘플값들이 쭉 있음.. 특정 곡이 어떤 곡인지 찾는다고 하면
샘플값을 다 비교해야 함. 시간이 문제 (비트끼리의 비교니까)
=> 메타데이터를 뽑아냄
음악으로부터 특징들을 뽑아냄 (Feature Extraction)
Feature는 100가지가 넘음
피쳐를 음악들로부터 다 뽑아서 메타 DB 형성
100곡에 대한 Feature Vector들이 다 있음
어떤 음악이 들어왔을 때 Feature를 끄집어내고 메타데이터를 비교하면 훨씬 짧은 시간에 서치 가능
* 근데 보통 녹음하면 잡음이 들어감
피쳐 벡터에 왜곡이 생기고 100% 일치 안됨.. 누가 가장 가까운지 수학적으로 찾아야 함 (Similarity)
피쳐 벡터를 뽑아내도 시간이 많이 걸림
=> Optimization 필요
.. 이러한 과정들을 패턴 인식이라 함
구현 시 가장 중요한 것?
1. Feature Extraction
2. Noize Reduction
3. 얼마나 빨리 검색하느냐