Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 엔트로피
- 선형 리스트
- lost function
- 인공지능
- DB
- 딥러닝 교차 엔트로피
- 확률분포
- 신경망
- 자연어처리
- DBMS
- 파이썬 날코딩으로 알고 짜는 딥러닝
- 교차 엔트로피
- 뇌를 자극하는 알고리즘
- 파라미터
- 순차 자료구조
- 편미분
- 딥러닝
- 컴퓨터구조
- 연결 자료구조
- 자료구조
- 딥러닝 교차엔트로피
- 퍼셉트론
- 회귀분석
- 파이썬 딥러닝
- 리스트
- 자료구조 알고리즘
- 단층퍼셉트론
- 단층 퍼셉트론
- 오퍼랜드
- 노드
Archives
- Today
- Total
YZ ZONE
[자연어처리] 2.1 자연어처리를 위한 수학 본문
2.2.1 확률기초
확률과 통계
기계 학습이 처리할 데이터는 불확실한 세상에서 발생하므로, 불확실성을 다루는 확률과 통계를 잘 활용해야함
확률변수 random variable
: ex) 윷의 다섯 가지 경우가 도, 개, 걸, 윷, 모
다섯가지 경우 중 한 값을 갖는 확률변수를 x라고 할때 x의 정의역은 {도, 개, 걸, 윷, 모}
확률분포
각각의 확률이 얼만큼씩 나올 수 있는냐. 어떠한 확률이 얼만큼 분포하느냐 를 나타냄
-확률질량함수: 각각의 경우가 이산(끊어져 나누어있음)되어 있는 경우
-확률밀도함수: 각각의 경우가 연속되어있음
확률벡터 random vector
각각의 내용들이 얼만큼씩 나올 수 있느냐 확률을 벡터로 표현
예제)
주머니에서 번호를 뽑은 다음, 번호에 따라 해당 병에서 공을 뽑고 색을 관찰
번호를 y, 공의 색을 x라는 확률 변수로 표현하면 정의역은 y={1,2,3},x={파랑, 하양}
곱 규칙: P(y,x) = P(x|y)P(y)
: 어떤 사건이 일어나고 나서 그 뒤의 사건에 대한 확률.즉 두개가 이어지는 결합확률.
ex) 1번 카드를 뽑고 나서 하양일 확률?
-1번 카드를 뽑을 확률: P(y=1) = P(1) = 1/8
-카드는 1번, 공은 하양일 확률: P(y=1, x=하양) = P(x=하양 | y=1)P(y=1) = 9/12 * 1/8 = 3/32
조건부 확률 | 로 표현 (y가 1일때 x가 하양일 확률)
합 규칙
:이어지지 않을때 합규칙.
ex) 하양 공이 뽑힐 확률 ? 1번에서 하양을 뽑은 확률+2번에서 하양일 확률+3번에서 하양일 확률
P(하양) = P(하양|1)P(1) + P(하양|2)P(2) + P(하양|3)P(3) = 9/121/8 +5/154/8+3/6*3/8 = 43/96
'IT > 자연어처리' 카테고리의 다른 글
[자연어처리] 2.5 자연어처리를 위한 수학(정보이론) (0) | 2023.02.02 |
---|---|
[자연어처리] 2.4 자연어처리를 위한 수학(평균과 분산) (0) | 2023.02.02 |
[자연어처리] 2.3 자연어처리를 위한 수학(최대우도) (0) | 2023.02.02 |
[자연어처리] 2.2 자연어처리를 위한 수학(베이즈 정리) (0) | 2023.02.02 |
[자연어처리] 1. 자연어처리의 기본 (0) | 2023.02.02 |