이론 관련/수학 관련2023. 3. 18. 18:11

유튜브 알고리즘으로 보게 된 내용

빅 데이터 등에서 차원이 높아질수록(DB에서는 개별 entity의 정보가 늘어날 수록)

유사함의 기준으로 삼을 수 있는 부분이 점점 줄어들게 되고

이는 곳 같다 , 다르다 의 판단으로 사용할 수 없게 됨을 의미한다.

그래서 적절하게 차원을 낮춰서(즉 비교 변수의 갯수를 줄여) 처리 하거나

그게 아니라면 빅 데이터로 빈 공간을 줄여서 판단의 근거로 삼거나..

 

일단은 해당 용어는 데이터 마이닝에서 나왔다고 한다.

[링크 : https://en.m.wikipedia.org/wiki/Curse_of_dimensionality]

[링크 : https://youtu.be/EXHR2-hECRM]

 

'이론 관련 > 수학 관련' 카테고리의 다른 글

추세선 알고리즘 (선형회귀)  (0) 2023.03.08
가우스 소거법  (0) 2023.01.19
텐서 합  (0) 2021.06.22
텐서 곱  (0) 2021.06.14
데이터 사이언스 / 사이언티스트  (0) 2019.12.09
Posted by 구차니