728x90

1.1

총 7개 버전의 공간이 존재

Hint. 총 3가지 상황으로 나눠 생각해볼 수 있다.

 

 

1.2

2^18 - 1

= 262,143 개

 

참고 코드:

github.com/datakim/datakim.github.io/blob/master/chapter1_2

 

 

1.3

일반적으로 두 개의 샘플이 비슷한 속성을 가질수록 동일한 클래스(class)에 속할 확률이 높아집니다. 만약 동일한 속성을 가졌지만 다른 클래스로 분류되는 샘플이 있다면, 일부 정보 손실을 감수하고 두 샘플 중 양성 샘플만 남기거나 모든 샘플을 제거합니다.

 

 

1.4

증명을 하기 전에 다음과 같은 보조 정리(lemma)가 필요합니다.

보조 정리: 이진 분류 문제에서 임의의 성능 척도는 l이고, l(h(x)=f(x))+l(h(x)≠f(x))=A 이며, A는 상수이다.

증명: 이진 분류 문제에서 임이의 성능 척도의 정확도 점수와 오차울 점수는 고정되어 있다.

즉,

l(0,0)=l(1,1),l(0,1)=l(1,0) 이며,

따라서

l(0,0)+l(0,1)=l(1,1)+l(1,0)

이다.

l(0,0)+l(0,1)=l(1,1)+l(1,0)=A 와 같이 설정하면,

l(h(x)=f(x))+l(h(x)≠f(x))=A 을 얻는다.

공짜 점심 정리에 대해 증명해보자.

위 식은 결과와 학습 알고리즘 εa는 무관하다는 것을 설명하며, '공짜 점심은 없다'는 여전히 성립합니다.

 

 

1.5

개방형 문제 (정해진 답은 없다)

ex. 검색결과를 보여줄때 유저의 흥미에 맞는 순서대로 노출한다.

+ Recent posts