이 질문들의 출처는 https://jrc-park.tistory.com/259 입니다!
+ 검색 했어용
1) AI, ML, DL의 차이점 [Answer Post]
2) 지도학습, 비지도학습, 강화학습 정의 및 종류
3) eigenvector, eigenvalue란
4) pca 개념설명
5) singular value decompositon이란
6) precision, recall, F1의 무엇이고 왜 쓰는가
7) MLE와 MAP의 가장 큰 차이점은?
8) 베이즈 정리란
9) SVM이란
10) Kernel Trick이란
11) FC Layer란
12) 활성함수 종류란 사용하는 이유
13) Backpropagation(역전파)이란
14) 경사하강법이란
15) convolution layer란:
16) Batch normalization이란
17) RNN/ LSTM/ ATTENTION이란
Statistic / Probability
-
- 🧐 Central Limit Theorem 이란 무엇인가? <답 확인하기>
- 🙋🏻중심 극한 정리 :
- 평균이 , 표준편차가 인 임의의 모집단으로부터 크기 n인 표본에서의 표본평균은 n이 클 때 근사적으로 평균이 이고, 분산이 인 정규분포를 따른다.
- 모집단이 정규 분포라면 표본 평균은 표본의 개수와 상관 없이 항상 정규 분포를 따른다.
- 🙋🏻중심 극한 정리 :
- 🧐 Central Limit Theorem은 어디에 쓸 수 있는가?
- 🧐 큰수의 법칙이란?
- 🧐 확률이랑 통계랑 다른 점은?
- 🧐 Marginal Distribution이란 무엇인가?
- 🙋🏻 확률 변수의 집합에서 특정 확률 변수를 제외한 변수들을 무시하고 측정한 특정 확률 변수의 분포임
- 🧐 Conditional Distribution이란 무엇인가?
- 🙋🏻조건부 확률은 특정 사건이 있다고 가정했을 때 발생할 확률을 의미
- 🧐 Bias란 무엇인가? [Answer Post]
- 🙋🏻 측정값과 실제 label의 차이를 의미
- 🧐 Biased/Unbiased estimation의 차이는? [Answer Post]
- 🙋🏻 Biased Estimation은 모수의 추정량이 기대값이 모수의 값들과 일치하지 않는 것을 의미함
- 🙋🏻 Unbiased Estimation: 모수의 추정량이 기댓값이 모수가 되는 성질
- 🧐 Bias, Variance, MSE란? 그리고 그들의 관계는 무엇인가?
- 🙋🏻 편차, 분산, MSE는 분산 + 편차에 관련된 식으로 나타 낼 수 있음
- 🙋🏻 bias와 variance는 모델의 Loss 또는 error를 의미
- 🙋🏻 bias(편차)는 참 값들과 추정 값들의 사이(평균간의 거리)를 의미, // variance(분산)는 추정 값들의 흩어진 정도를 의미
- 🙋🏻 MSE (MSE, Mean Squared Error, 평균 제곱 오차) : 실제값과 예측값의 차이를 제곱해 평균화, 예측값과 실제값 차이의 면적의 평균과 같다. 특이값이 존재하면 수치가 많이 늘어난다
- 🧐 Sample Variance란 무엇인가?
- 🙋🏻 표본 분산
- 🧐 Variance를 구할 때, N대신에 N-1로 나눠주는 이유는 무엇인가?
- 🙋🏻 표본 분산의 기대값이 모분산이여야 하므로 = 불편 추정량을 만족하기 위함 (증명은 <이곳>)
- 🧐 Gaussian Distribution에서 MLE와 Sample Variance 중에 어떤 걸 사용해야 하는가?
- 🧐 Unbiased Estimation은 무조건 좋은가?
- 🧐 Unbiaed Estimation의 장점은 무엇인가?
- 🧐 Binomial, Bernoulli, Multinomial, Multinoulli 란 무엇인가? <답 확인하기>
- 🧐 Beta Distribution과 Dirichlet Distribution이란 무엇인가?
- 🧐 Gamma Distribution은 어디에 쓰이는가? <답 확인하기>
- 🧐 Possion distribution은 어디에 쓰이는가? <답 확인하기>
- 🧐 Bias and Varaince Trade-Off 란 무엇인가? [Answer Post]
- 🧐 Conjugate Prior란? <답 확인하기>
- 🧐 Confidence Interval이란 무엇인가? <답 확인하기>
- 🧐 covariance/correlation 이란 무엇인가?
- 공분산/ 상관계수 -> 각 데이터들이 얼마나 관련 있는지 어떻게 퍼져있는지에 대한 수치
- 🧐 Total variation 이란 무엇인가? <답 확인하기>
- 🧐 Explained variation 이란 무엇인가? <답 확인하기>
- 🧐 Uexplained variation 이란 무엇인가 <답 확인하기>
- 🧐 Coefficient of determination 이란? <답 확인하기>
- 🧐 Total variation distance이란 무엇인가?
- 🧐 P-value란 무엇인가? <답 확인하기>
- 🧐 likelihood-ratio test 이란 무엇인가?
Machine Learning
- 🧐 Frequentist 와 Bayesian의 차이는 무엇인가?
- 🧐 Frequentist 와 Bayesian의 장점은 무엇인가?
- 🧐 차원의 저주란? <답 확인하기>
- 🧐 Train, Valid, Test를 나누는 이유는 무엇인가?
- 🧐 Cross Validation이란?
- 🧐 (Super-, Unsuper-, Semi-Super) vised learning이란 무엇인가?
- Supervised Learning / Unsupervised Learning / Semi-Supervised Learning
- Supervised Learning / Unsupervised Learning / Semi-Supervised Learning
- 🧐 Decision Theory란?
- 🧐 Receiver Operating Characteristic Curve란 무엇인가? <답 확인하기>
- 🧐 Precision Recall에 대해서 설명해보라 <답 확인하기>
- 🧐 Precision Recall Curve란 무엇인가? <답 확인하기>
- 🧐 Type 1 Error 와 Type 2 Error는? <답 확인하기>
- 🧐 Entropy란 무엇인가? <답 확인하기>
- entropy란 최적의 전략 하에서 그 사건을 예측하는데에 필요한 질문 개수를 의미함. 다른 표현으로는 최적의 전략 하에서 필요한 질문 개수에 대한 기대값이다. 따라서, 이 entropy가 감소한다는 것은 우리가 그 사건을 맞히기 위해서 필요한 질문의 개수가 줄어드는 것을 의미한다. 질문의 개수가 줄어 든다는 사실은 정보량도 줄어든다는 의미이다.
- 🧐 KL-Divergence란 무엇인가? <답 확인하기>
- 🧐 Mutual Information이란 무엇인가?
- 🧐 Cross-Entropy란 무엇인가? <답 확인하기>
- 어떤 문제에 대해 특정 전략을 쓸 때 예상되는 질문 개수에 대한 기댓값. 최적의 전략을 사용할때 cross entropy값이 최소가 된다. 확률분포로 된 어떤 문제 p에 대해 확률 분포로 된 어떤 전략 q를 사용할때 질문 개수의 기댓값이 바로 cross entropy.
- 🧐 Cross-Entropy loss 란 무엇인가?
- 🧐 Generative Model이란 무엇인가?
- 🧐 Discriminative Model이란 무엇인가?
- 🧐 Discrinator function이란 무엇인가?
- 🧐 Overfitting 이란? [Answer Post]
- 🧐 Underfitting이란? [Answer Post]
- 🧐 Overfitting과 Underfitting은 어떤 문제가 있는가?
- 🧐 Overfitting과 Underfitting을 해결하는 방법은? [Answer Post]
- 🧐 Regularization이란?
- Ridge / Lasso
- Ridge / Lasso
- 🧐 Activation function이란 무엇인가? <답 확인하기>
- 3가지 Activation function type이 있다.
- Ridge activation Function / Radial activation Function / Folding activation Function
- 🧐 CNN에 대해서 설명해보라
- 🧐 RNN에 대해서 설명해보라
- 🧐 Netwon's method란 무엇인가?
- 🧐 Gradient Descent란 무엇인가? <답 확인하기>
- 🧐 Stochastic Gradient Descent란 무엇인가? <답 확인하기>
- 🧐 Local optimum으로 빠지는데 성능이 좋은 이유는 무엇인가?
- 🧐 Internal Covariance Shift 란 무엇인가? <답 확인하기>
- 🧐 Batch Normalization은 무엇이고 왜 하는가?
- 🧐 Backpropagation이란 무엇인가? <답 확인하기>
- 🧐 Optimizer의 종류와 차이에 대해서 아는가? <답 확인하기>
- 🧐 Ensemble이란? <답 확인하기>
- 🧐 Stacking Ensemble이란?
- 🧐 Bagging이란? <답 확인하기>
- 🧐 Bootstrapping이란?
- 🧐 Boosting이란? <답 확인하기>
- 🧐 Bagging 과 Boosting의 차이는?
- 🧐 AdaBoost / Logit Boost / Gradient Boost
- 🧐 Support Vector Machine이란 무엇인가?
- 🧐 Margin을 최대화하면 어떤 장점이 있는가?
- 🧐 나이브 베이즈 분류기란? <답 확인하기>
- 🧐 Log Sum EXP란?
Linear Algebra
- 🧐 Linearly Independent란?
- 🧐 Basis와 Dimension이란 무엇인가?
- 🧐 Null space란 무엇인가?
- 🧐 Symmetric Matrix란?
- 🧐 Possitive-definite란?
- 🧐 Rank 란 무엇인가?
- 🧐 Determinant가 의미하는 바는 무엇인가?
- 🧐 Eigen Vector는 무엇인가?
- 🧐 Eigen Vector는 왜 중요한가?
- 🧐 Eigen Value란?
- 🧐 SVD란 무엇인가?→ 중요한 이유는?
- 🧐 Jacobian Matrix란 무엇인가?
단순히 개념을 물어보는 질문도 있고, 조금더 Advanced된 질문들도 있습니다. 정답을 암기하는 것보다 각 개념들이 지니는 의미를 이해하고 정답을 찾아가면서 공부하시는 것을 추천드립니다. 🤗🤗
정답
[1] Machine Learning에서 Bias란 무엇인가?
[2] Biased, Unbiased Estimator란 무엇인가?
[4] Machine Learning에서 Overfitting과 Underfitting은 뭘까..?
https://shiningyouandme.tistory.com/47
반응형
'0_0' 카테고리의 다른 글
AI, ML, DL의 차이점 (0) | 2022.11.29 |
---|